2003/28 Notater Anna-Karin Mevik. Notater. Usikkerhet i konjunkturbarometeret. Seksjon for statistiske metoder og standarder Emnegruppe: 08.

Størrelse: px
Begynne med side:

Download "2003/28 Notater Anna-Karin Mevik. Notater. Usikkerhet i konjunkturbarometeret. Seksjon for statistiske metoder og standarder Emnegruppe: 08."

Transkript

1 003/8 Notater 003 Anna-Karin Mevik Notater Usikkeret i konjunkturbarometeret Seksjon for statistiske metoder og standarder Emnegruppe: 08.90

2 Innold 1. Innledning Populasjon Stratifisering av populasjonen Diffusjonsindeksen til populasjonen Utvalg Trekking av nytt utvalg Supplering og rullering av utvalget Innsamling av data Estimering av diffusjonsindeksen Designbasert analyse av estimert diffusjonsindeks Lineærisering Bootstrap Modellbasert analyse av estimert diffusjonsindeks Talleksempel Alternativ estimator: Basert på en korrigert Horvitz-Tompson-estimator Designbasert analyse Modellbasert analyse Talleksempel Alternativ estimator: Basert på beste lineære prediktor Designbasert analyse Modellbasert analyse Talleksempel Oppsummering...47 De sist utgitte publikasjonene i serien Notater

3

4 1. Innledning I dette notatet skal vi se vordan vi kan måle og estimere usikkereten i konjunkturbarometeret. I kapittel til 7 tar vi for oss usikkereten til nåværende estimator mens vi i kapittel 8 og 9 skal se på usikkereten til to alternative estimatorer. Vi vil se bort fra mulige feilkilder som målefeil registerfeil og frafall og kun se på usikkereten som kommer av at vi estimerer en populasjonstotal på bakgrunn av et utvalg fra populasjonen. Denne usikkereten angis vanligvis med det designbaserte standardavviket men er skal vi også se på et modellbasert standardavvik. Selv om vi ar valgt å se bort fra effekten av frafall tar estimatoren som benyttes i konjunkturbarometeret ensyn til visse typer frafall. Er f.eks. frafallet tilfeldig innen vert stratum pga. sammeneng med sysselsettingen vil dette ikke medføre frafallsskjevet. Konjunkturbarometeret er en kvartalsvis kartlegging av industriens vurderinger av konjunktursituasjonen og -utsikten for en del faste kjennetegn. Det gis blant annet en sysselsettingsveid indeks kalt diffusjonsindeks for industriens forventede produksjon i neste kvartal sammenlignet med inneværende kvartal. Det er for denne indeksen vi vil estimere usikkereten (men estimatorene vi kommer frem til vil også passe for tilsvarende indekser i konjunkturbarometeret). Vi starter i avsnitt med å gi en beskrivelse av populasjonen og diffusjonsindeksen. I neste avsnitt avsnitt 3 gir vi en kort beskrivelse av utvalget og vordan det trekkes. Selve estimatoren som benyttes til å estimere diffusjonsindeksen presenterer vi i avsnitt 4. I avsnitt 5 og 6 gir vi en designbasert og en modellbasert analyse av denne estimatoren. Usikkeretsmålene vi får fra disse analysene ar vi så benyttet til å estimere usikkereten i konjunkturbarometeret i perioden og 00. Resultatene av dette gir vi i avsnitt 7. I avsnitt 8 og 9 ser vi på to alternative estimatorer for diffusjonsindeksen. Helt til slutt gir vi en oppsummering i avsnitt 10.. Populasjon Populasjonen består av alle bransjeeneter innen industri og bergverksdrift. Med næringsgrupperingen i SN94 (standard for næringsgruppering 1994) betyr det alle bransjeeneter innen næringene og Før vi forklarer va vi er mener med en bransjeenet nevner vi at alle bedrifter er sortert under næringsovedgrupper: I SN94 er alle næringene delt opp i næringsovedgrupper også kalt 3-sifrede næringer og i BoF (Bedrifts- og foretaksregisteret) er alle bedriftene sortert under disse næringsovedgruppene. Et foretak kan inneolde flere bransjeeneter. En bransjeenet er definert ved alle bedriftene til foretaket som tilører samme næringsovedgruppe (se eksempel neste avsnitt). Bransjeeneten er selv sortert under den samme næringsovedgruppen som bedriftene. Det er BoF som til enver tid bestemmer vilke bransjeeneter som er med i populasjonen. For å gi et eksempel på en bransjeenet ser vi på Norsk Hydro. Norsk Hydro er et foretak som består av 44 bedrifter. Disse bedriftene er som nevnt sortert under næringsovedgruppene. F.eks. driver 8 av bedriftene med en virksomet som gjør at de er gruppert under næringsovedgruppen for utvinning av råolje og naturgass og disse 8 bedriftene utgjør således en bransjeenet. Videre er 14 av bedriftene gruppert under næringsovedgruppen for produksjon av kjemiske råvarer slik at disse bedriftene utgjør en bransjeenet. De resterende bedriftene til Norsk Hydro er sortert under 11 ulike næringsovedgrupper og utgjør dermed 11 bransjeeneter. 3

5 .1. Stratifisering av populasjonen Populasjonen stratifiseres etter sysselsetting og næringsovedgruppe. Dvs. at bransjeenetene grupperes etter vor stor sysselsetting de ar og vilken næringsovedgruppe de tilører. Inndelingsintervallene for sysselsetting er og Fordi det er ca. 100 næringsovedgrupper i populasjonen skulle dette tilsi omtrent 400 strata. Men fordi mange av næringsovedgruppene ikke ar bransjeeneter i alle sysselsettingsintervallene blir det ca. 70 strata... Diffusjonsindeksen til populasjonen For ver bransjeenet i populasjonen tenker vi oss at det fins en sysselsettingsveid indikator kalt bransjeenetens konjunktursysselsetting som angir vorvidt bransjeeneten forventer en økning nedgang eller ingen forandring i neste kvartals produksjon sammenlignet med inneværende kvartal. Mer presist tenker vi oss at det for ver bransjeenet i i vert stratum fins en konjunktursysselsetting y i gitt ved y i xi vis bransjeeneten forventer en økning i sin egen produksjon 1 = xi vis bransjeeneten ikke forventer noen endring i sin egen produksjon 0 vis bransjeeneten forventer en nedgang i sin egen produksjon. Her er x i bransjeenetens sysselsetting. For vert stratum ar vi også en konjunktursysselsetting. Denne er gitt ved Y = y i U i der U er indeksmengden for bransjeenetene i stratumet. Stratumets konjunktursysselsetting er med andre ord gitt ved den samlede sysselsettingen til de bransjeenetene (i stratumet) som tror på en økning i egen produksjon pluss alvparten av den samlede sysselsettingen til de bransjeenetene som ikke forventer noen endring. Dermed er stratumets konjunktursysselsetting alltid mindre eller lik sysselsettingen i stratumet dvs. Y der = x i U i er stratumets sysselsetting. Videre vil konjunktursysselsettingen flere av bransjeenetene som tror på en økning i egen produksjon. Ved å summere konjunktursysselsettingen til alle strata i populasjonen får vi populasjonens konjunktursysselsetting Y. Dvs. Y være større jo Y = Y 1 For noen næringsovedgrupper kan inndelingen etter sysselsetting være litt annerledes. 4

6 der summen er over alle strata i populasjonen. Konjunktursysselsettingen Y er alltid mindre eller lik den totale sysselsettingen i populasjonen og jo større optimisme det er blant bransjeenetene jo nærmere den totale sysselsettingen vil Y være. Vi er interessert i populasjonens diffusjonsindeks. Denne er gitt ved (1) Y d = 100 Y = 100 der = er den totale sysselsettingen i populasjonen. Dvs. at diffusjonsindeksen angir populasjonens konjunktursysselsetting Y i prosent av den totale sysselsettingen. På grunn av uliketen 0 Y vil d ligge mellom 0 og 100. Hvis d > 50 betyr det at bransjeenetene som forventer en økning i produksjonen sysselsetter flere arbeidstakere enn bransjeenetene som forventer en nedgang. At d < 50 betyr det motsatte dvs. at bransjeenetene som forventer en økning i produksjon sysselsetter færre arbeidstakere enn bransjeenetene som forventer en nedgang. Vi kan si at d > 50 indikerer vekst i produksjonen mens d < 50 indikerer reduksjon. Vi er også interessert i diffusjonsindekser som gjelder for spesielle grupper av strata (dvs. delmengder av populasjonen). Diffusjonsindeksen til en slik gruppe er gitt som (1) men vor summen bare går over de strataene som er med i gruppen. 3. Utvalg Ideelt sett skal det trekkes et nytt utvalg vert år og så skal det ved beov foretas supplering og rullering av utvalget i løpet av de fire kvartalene utvalget benyttes. I praksis følges ikke denne regelen elt. F.eks. er det ikke trukket nye utvalg i løpet av 1999 eller 000. Hver gang det trekkes et nytt utvalg så oppdateres populasjonsdataene mot BoF. Dermed stemmer populasjonsdataene overens med den faktiske populasjonen på det tidspunktet utvalget trekkes. Men når det samme utvalget brukes til å estimere diffusjonsindeksen på et senere tidspunkt kan det være avvik mellom populasjonsdataene og den faktiske populasjonen Trekking av nytt utvalg I (brutto-) utvalget som er på ca. 710 eneter inngår alle bransjeeneter med 300 eller flere sysselsatte fast. De resterende utvalgsenetene allokeres mellom strataene på en optimal måte for å sikre en viss dekningsgrad av den totale sysselsettingen og omsettingen i populasjonen. Allokeringen sikrer ikke at vi får utvalg fra alle strataene og vi kan dermed oppleve å a strata uten utvalg. Fordi konjunktursysselsettingen Y tilsvarer den samlede sysselsettingen til de bransjeenetene (i populasjonen) som tror på en økning i egen produksjon pluss alvparten av den samlede sysselsettingen til de bransjeenetene som ikke forventer noen endring tilsvarer d den prosentvise andelen av sysselsatte som jobber i bransjeeneter vor det forventes en økning i produksjonen pluss alvparten av den prosentvise andelen av sysselsatte som jobber i bransjeeneter vor det ikke forventes noen endring. 5

7 Strataenes utvalg trekkes uavengig av verandre og uten tilbakelegging. Innen vert stratum brukes det trekksannsynligeter som er proporsjonale med bransjeenetenes sysselsetting. Bransjeeneter med færre enn 10 sysselsatte er ikke med i trekkpopulasjonen. Det eneste unntaket er for grafisk industri der alle bransjeeneter er tatt med i trekkpopulasjonen. Grunnen til dette er at resultater fra grafisk industri brukes i et markedsoppdrag og derfor er dekningsgraden i denne næringsovedgruppen økt for å styrke disse resultatene. 3.. Supplering og rullering av utvalget Ved supplering og rullering av utvalget tas det blant annet ensyn til vor mange ganger en bransjeenet ar vært med i utvalget og vor stort frafall den ar. Det gjøres ingen ny allokering av utvalgsenetene og de nye bransjeenetene trekkes med trekksannsynligeter som er proporsjonale med sysselsettingen Innsamling av data Den kvartalsvise datainnsamlingen fra de utvalgte bransjeenetene skjer ved jelp av spørreskjema. Ett av spørsmålene på dette skjemaet er om vorvidt bransjeeneten forventer en økning nedgang eller ingen forandring i neste kvartals produksjon sammenlignet med inneværende kvartal. På bakgrunn av svaret som gis beregnes så bransjeenetens konjunktursysselsetting. Vanligvis er det den største bedriften innen bransjeeneten som skal svare men for noen bransjeeneter er det valgt ut flere bedrifter som alle skal svare. I sistnevnte tilfelle beregnes det en konjunktursysselsetting for vert av svarene til de leverede bedriftene og bransjeenetens konjunktursysselsetting er gitt ved gjennomsnittet av disse. 4. Estimering av diffusjonsindeksen I konjunkturbarometeret estimeres diffusjonsindeksen (1) med () Yˆ ˆ d = 100 der y (3) ˆ s Y = x s er en rateestimator for stratumets konjunktursysselsetting Y = y. Her er i U i x s og enoldsvis gjennomsnittlig sysselsetting og gjennomsnittlig konjunktursysselsetting i stratumets (netto-) utvalg dvs. 1 1 x = x og y y = n n s i s i i s i s der s er stratumets (netto-) utvalg og n er antall bransjeeneter i dette utvalget. y s 6

8 Rateestimatoren (3) krever at vi ar et utvalg fra stratumet. Som nevnt kan vi a strata uten utvalg. Antakeligvis blir slike strata fjernet fra populasjonen når ˆd skal beregnes slik at summen i () bare er over de strataene vor vi ar utvalg. På grunn av uliketen 0 yi xi ar vi uliketen 0 ys x s slik at 0 Yˆ. Dette gir at ˆd ligger mellom 0 og 100 noe som er en nødvendig egenskap siden diffusjonsindeksen ligger mellom 0 og 100. I de neste to avsnittene skal vi se på flere egenskaper til ˆd. Diffusjonsindeksen til grupper av strata estimeres også med () men igjen med summen over de strataene som er med i gruppen. kun 5. Designbasert analyse av estimert diffusjonsindeks I dette avsnittet skal vi gjøre en designbasert analyse av ˆd. At analysen er designbasert betyr at vi ser på bransjeenetenes konjunktursysselsettinger som ukjente parametere mens utvalget av bransjeeneter er stokastisk. I dette avsnittet vil derfor alle forventninger og varianser gjelde for denne situasjonen. Vi vil anta at vi ar utvalg fra alle strata og vi vil se bort fra frafall registerfeil og målefeil. Vi ønsker ofte at en estimator skal være forventningsrett. For ˆd betyr dette at forventningen skal være lik d for alle mulige kombinasjoner av de verdiene som y i 'ene kan a. Men dette er ikke tilfelle. 3 For å se det skriver vi forventningen til ˆd som EYˆ E ˆ d = 100 der EY ˆ er forventningen til Y ˆ. Som vi skal se senere er Y ˆ generelt ikke forventningsrett: Noen konfigurasjoner av y i 'ene kan gjøre at EY ˆ er større enn Y andre at EY ˆ er mindre enn Y. Dermed kan forventningen til ˆd bli både større og mindre enn d avenging av y i 'ene og følgelig er ˆd ikke forventningsrett. Ved å bruke uavengigeten mellom stratumsutvalgene finner vi at variansen til ˆd er gitt ved ( ) ( ˆ V Y ) ( ) V = Selv om ˆd ikke er forventningsrett finnes det mange konfigurasjoner av y i 'ene som gjør at foroldet y / x er konstant for alle bransjeeneter innen vert stratum så er Y ˆ Y i i E Yˆ = Y slik at E = d. 7 ˆ Ed =. Dermed er = d. Hvis f.eks.

9 der V( ˆ ) skrives som Y er variansen til Y ˆ. Dermed kan standardavviket som er kvadratroten av variansen for ˆd (4) ( ) ( Yˆ ) V st = 100. Som nevnt brukes ofte standardavviket for å angi usikkereten til en estimator. Men når estimatoren ikke er forventningsrett er kanskje bruttovariansen et vel så bra usikkeretsmål. Bruttovariansen er forventet kvadratavvik mellom estimator og estimand og kan skrives som variansen pluss kvadratet av forventningsskjeveten. (Forventningsskjeveten til en estimator er forventningen til estimatoren minus estimanden). Dvs. at bruttovariansen til ˆd er MSE d der Bias ˆ ˆ ˆ = E ( d d) = ˆ ˆ + V d Bias d d = E d er forventningsskjeveten til ˆd. Til tross for at ˆd ikke er forventningsrett velger vi å bruke standardavviket som usikkeretsmål. Grunnen til dette er at vi ikke klarer å estimere bruttovariansen. (I underavsnitt 5.1 gir vi en øvre og nedre grense for forventningsskjeveten til ˆd ). Fordi standardavviket (4) er ukjent må vi estimere det. Det gjør vi ved å estimere variansen til Y ˆ 'ene. Fordi vi ikke ar noen standardestimator for V( Y ˆ ) skal vi i underavsnitt 5.1 estimere denne variansen ved jelp av lineærisering. Vi ar også prøvd å finne en Bootstrapmetode som er egnet til å V Y ˆ uten å finne det. (I underavsnitt 5. gir vi en kort presentasjon av Bootstrap). estimere ( ) Før vi går i gang med lineæriseringen skal vi se litt på trekksannsynligetene til bransjeenetene. Vi skal også se på situasjonen n = 1 dvs. en situasjon vor det er umulig å estimere variansen på vanlig måte. Trekksannsynligeten til en bransjeenet er sannsynligeten for at bransjeeneten blir trukket ut til å være med i utvalget. Som notasjon for denne sannsynligeten bruker vi π i for bransjeenet i i stratum. Fordi bransjeeneter med færre enn 10 sysselsatte ikke er med i trekkpopulasjonen (med unntak av bransjeenetene i grafisk industri) er π i = 0 for disse bransjeenetene. For de øvrige bransjeenetene er π i proporsjonal med sysselsettingen (innen vert stratum). Med notasjonen { s.a. 0} i U = i U π > 8

10 ar vi derfor at π i = 0 når ( i U ) i U og i n ( xi / x i U i ) π = når n xi / xi 1 for alle oss at U = U når sysselsettingsintervallet i stratumet ikke er i U (forutsatt at i U noe som er tilfelle for de aller fleste strataene). Vi kan merke For stratum der n = 1 er det umulig å estimere variansen. For slike strata velger vi derfor å bruke en øvre grense som en konservativ estimator for variansen. For å komme fram til en øvre grense benytter vi at når n = 1 er Yˆ = ( yi / x ) s i s og π i = xi / x i U i. (Her er i s den utvalgte bransjeeneten i stratumet). Dette gir forventningen (5) EYˆ y = π i i x i U i = y + i U i i U y x i i i U i U x i som generelt ikke er lik Y. Dvs. at Y ˆ generelt ikke er forventningsrett. Men vis U EYˆ = Y dvs. forventningsrett. Variansen til Y ˆ kan nå skrives som = U får vi (6) =. y yi / xi y is i U i i U V xi s xi x i U i i U Ved å benytte at yi x i slik at yi / x i y i y i y i U i i U i U i U = x x x x 4 i U i i i i i U i U i U får vi y V x is is 1 4. V ˆ /4 når n = 1 og det er denne grensen vi vil estimere variansen med. (Teoretisk Dvs. at ( Y ) sett kunne vi funnet en bedre grense ved å maksimere (6) med ensyn på de mulige konfigurasjonene y i 'ene kan a. Men vis N er stor kan denne maksimeringen være vanskelig å gjennomføre i praksis). 9

11 5.1. Lineærisering V θ der θ= ˆ g ( y ) er en estimator for g Y = ( Y1 Yp ) og = ( y1 y p ) Ved å gjøre en 1. ordens Taylorutvikling av g rundt forventningen Ey = ( E y1...ey p ) får vi Anta generelt at vi skal estimere variansen ( ˆ ) tilnærmingen θ= Y. Her er y vektorene av enoldsvis populasjons- og utvalgsgjennomsnitt. ( E ) + j( j E j) g y g y a y y der a ( E ) j j p j= 1 g = y. Dette gir oss følgende tilnærming av variansen til ˆθ : y der C ( i j ) p p p ( θˆ ) a j ( yj) + ajai ( yj yi) V V C j= 1 j= 1 i= 1 i j y y står for kovariansen til y i og med aˆ g/ y j = j y og V( j ) y og C ( j i) I vår situasjon er det variansen til Yˆ g( ys xs ) Tilnærmingen av Y ˆ blir s 1 (7) og gir at y j. Variansen ( ˆ ) V θ kan nå estimeres ved å estimere y y med passende valgte estimatorer. = der Ey Ey ˆ s Y + ys Ey ( E ) s xs x s Exs Ex s Ex ( ˆ ) ( Eys ) ( s ) g y1 y = y1/ y som skal estimeres. 1 Ey s ( s ) 4 ( s ) 3 s s Exs Exs Exs V Y V y + V x C x y. Den foreslåtte variansestimatoren for Y ˆ er dermed ( ys ) 1 y s 4 ˆ s s 3 s s xs xs xs Vˆ Yˆ = Vˆ y + Vˆ x C x y der ˆV ( y s ) ˆV ( x s ) og Ĉ ( xs y s ) er estimatorer for enoldsvis V( y s ) V( x s ) og C ( s s ) Vi trenger altså å finne estimatorer for V( y s ) V( x s ) og C ( s s ) y s. Denne kan skrives som a j x y. x y. Vi ser først på variansen til 10

12 V 1 ( ys ) = yiyj πij πiπj n i U j U 1 1 = π π π n ( i j ij )( yi yj ) i U j U j i der ij π er sannsynligeten for at bransjeenet i og j er med i utvalget og π ii =π i. To estimatorer for denne variansen er ˆV ( ys ) 1 y y π π π = n π HT i s j s i j ij i j ij og ˆV 1 1 i j ij ( y ) s = yi yj. SYG n i s j s j i π π π π ij (HT står for Horvitz-Tompson og SYG står for Sen-Yates-Grundy). Begge disse estimatorene ar den gode egenskapen at de er forventningsrette vis π ij er positiv når π i og π j er det. 4 Men dessverre ar de også den ueldige egenskapen at de kan bli negative. Problemet med både ˆV HT ( y ) og ˆV SYG s y er at vi må kjenne π ij 'ene. Når i= j ar vi at s π ij =π ii =π i og når i j samtidig som π i eller π j = 1 så er π ij =πiπ j. Dermed kjenner vi disse π ij 'ene (fordi π i er kjent). Men når i j samtidig som π i og πj 1 kjenner vi ikke π ij. V y velger vi derfor å tilnærme de ukjente For å kunne estimere ( y s ) med ˆV HT ( y ) eller ˆV SYG π ij 'ene med ( n 1) N ij i j n π ˆ = π π ( N 1) s der s N er antall bransjeeneter i stratum som ar π > 0. 5 Med denne tilnærmingen av de ukjente π ij 'ene får vi at πiπj πij 0 for alle i j. Dette medfører at ˆV SYG y alltid er positiv. Videre kan det vises at vis π ij er proporsjonal med xix j s i 4 Hvis π ij > 0 når π i og j 0 π > ar vi at ˆV ( y ) vis bransjeenet i er med i utvalget og 0 ellers. Dermed er E Vˆ HT ( y s ) 1 y y π π π n yi yj ( ij i j ) I I der I i = 1 1 π π π = n HT s i j π i U ij j U = ( y ) E i j ij i j IiI j = V ij s π π = i U ij j U Vˆ SYG ( ˆ ) Y er forventningsrett. i U j U 1 y y π π π n π i j ij i j. En tilsvarende fremgangsmåte viser at også 5 Denne tilnærmingen ar vi fra kursmaterialet til et kurs i modellbasert utvalgsteori (forelest av Ray Cambers). ij 11

13 når i j i j U blir ˆV SYG ( y s ) større når vi bruker π ˆ ij enn når vi bruker π ij. For ˆV HT ( s ) vi det motsatte dvs. at ˆV HT ( y s ) blir mindre når vi bruker π ˆ ij enn når vi bruker π ij. Av disse grunner velger vi å estimerer V( y s ) med ˆV ( y SYG ) dvs. vi estimerer V ( y ) s med 1 1 i j ij (8) ˆV SYG ys = yi yj der n i s j s j i π π πˆ πˆ ij s y får π i når i = j N( n π ˆ ij = π når 1 og 1 iπj i j πi πj n( N 1) π i π j når i j og π i eller π j = 1. På tilsvarende måte som vi ar kommet frem til estimatoren (8) for V( y s ) estimatorene 1 1 πˆ i j ij (9) ˆV SYG xs = xi xj og n i s j s 1 1 j i π π i j ij (10) Ĉ SYG ( xs y ) s = xi xj yi yj for V( x s ) og C ( s s ) (11) n i s j s j i πˆ ij π π πˆ πˆ ij x y respektivt. Variansestimatoren for Y ˆ blir dermed ( ys ) kommer vi frem til 1 y s SYG SYG ˆ s 4 s 3 SYG s s ( xs ) x s x s Vˆ Yˆ = Vˆ y + Vˆ x C x y der ˆV SYG ( y ) ˆV SYG ( x ) og Ĉ SYG ( s s ) s denne estimatoren alltid er positiv. s x y er gitt ved enoldsvis (8) (9) og (10). Det kan vises at Estimatoren (11) gjelder bare for strata vor n > 1. Når n = 1 skal vi som nevnt estimere variansen med den øvre grensen /4. Ved så å benytte at ( ˆ V Y ) = 0 når n = N ender vi opp med følgende estimator for standardavviket (4): 1

14 (1) ( ) der og V ˆ ( ˆ ) ( Yˆ ) V st = når n = N 1 V ( ˆ Y ) når n 1 N 4 V ˆ ( Yˆ ) når 1< n < N = = < Y er gitt ved (11). Vi ar sett at Y ˆ generelt ikke er forventningsrett når n = 1 og vi skal nå vise at det samme gjelder for stratum der n > 1. Når n > 1 ar vi ikke noe eksakt uttrykk for forventningen men fra tilnærmingen (7) får vi at den kan tilnærmes med (13) Ey E ˆ s Y Ex s yiπ i U i = x π i U i i. Dette tilnærmede uttrykket er generelt ikke lik Y. Vi kan nemlig for de fleste verdier av x i 'ene finne konfigurasjoner av y i 'ene som gjør at det tilnærmede uttrykket enten er større eller mindre enn Y. Anta f.eks. at vi ar et stratum der N = 5 n = x i 'ene er gitt ved og de respektive i E ys / Exs 396 mens y 'verdiene er 0 10/ 130/ 130/ og 170. Dette gir at Y = 360. Dvs. at den tilnærmede forventningen i dette tilfellet er større enn Y. Er derimot de respektive i E ys / Exs 55 og Y = 90 y 'verdiene gitt ved / 130/ 130/ og 0 får vi at. Dvs. at nå er den tilnærmede forventningen mindre enn Y. Under forutsettingen om at tilnærmingen (13) bra nok ar vi derfor at Y ˆ generelt ikke er forventningsrett. Fordi Y ˆ ikke er forventningsrett er ˆd ikke forventningsrett. Dette betyr at forventningsskjeveten til ˆd Bias ( d ˆ ) ikke er 0 for alle konfigurasjoner som y i 'ene kan a. Vi skal nå finne en øvre og nedre grense for denne forventningsskjeveten. Vi finner at der Bias( ˆ ) ( Yˆ ) Bias ˆ Bias( d ) = 100 Y E ˆ = Y Y er forventningsskjeveten til Y ˆ. For strata der n = 1 får vi fra (5) at 13

15 Bias ( Yˆ ) = c y i i i U der c x x = når i i U i i i U i U og 1 når i U. (Når skal). For strata der n > 1 benytter vi tilnærmingen (13) og får Bias i i i U xiπi i U ( ˆ ) i U y Y Y = b y i π i U = U blir ( ˆ ) Bias Y = 0 som det der b i πi = 1 x π i U j j. Fordi ( ˆ ) Bias Y = 0 når n = N gir dette oss bi yi + ci yi s.a. 1 < n< N i U s.a. n= 1< N i U Bias 100. (14) ( ) Ved å benytte at 0 biyi bixi når bi 0 bi xi bi yi 0 når bi 0 og får vi uliketen x c y x i U i i i i i U i U der bi yi + ci yi s.a. 1 < n< N i U s.a. n= 1< N i U L 100 U bix i x i s.a. 1 n s.a. 1 < < N i A L= c n= < N i U 100 bixi + x i s.a. 1 n s.a. 1 < < N i A n= < N i U U=

16 c = { s.a. 0} og { s.a. 0} A i b i A = i b i <. Under forutsetingen at tilnærmingen (13) er bra nok kan vi dermed bruke L som en nedre grense og U som en øvre grense for forventningsskjeveten til ˆd dvs. at ( d ˆ ) L Bias U. Vi vil bemerke at grensene L og U avenger av sysselsettingen til bransjeeneten i populasjonen og av n 'ene. Derfor kan grensene bli forskjellige fra et kvartal til et annet vis populasjonsdataene eller n 'ene ar endret seg. Vi vil også presisere at forventningsskjeveten avenger av vilke verdier y i 'ene ar. Selv om det viser seg at grensene L og U er store fins det veldig mange konfigurasjoner y 'ene som bare gir liten forventningsskjevet. av i Hvis vi ar en konfigurasjon av y i 'ene slik at forventningsskjeveten til ˆd er tilnærmet 0 kan vi lage til konfidensintervall for d. Vi tar da utgangspunkt i at d st d Y Y ˆ ( ˆ { ) ˆ Y Y E Y Y } V( ˆ ) når Bias ˆ ( d ) 0. Under visse betingelser på V( Y ˆ Y ) ( d ˆ ) st ( d) dermed gitt ved ± 1.96 st ˆ ( d ). Fordi st ˆ ( d ) er ukjent putter vi inn estimatoren ˆ bruker får vi derfor fra Lindebergsetningen at er tilnærmet standardnormalfordelt. Et tilnærmet 95% konfidensintervall for d er (15) ± 1.96 st ˆ ( d ) som et 95% konfidensintervall for d. st d for denne og 5.. Bootstrap Enkelt sagt går Bootstrap ut på å trekke nye utvalg fra det opprinnelige utvalget. På bakgrunn av disse utvalgene beregnes det nye estimater som benyttes til å estimere variansen til den opprinnelige estimatoren. Ideen er at utvalgene skal trekkers på en slik måte at Bootstrapestimatoren for variansen konvergerer mot en tilfredsstillende variansestimator når vi trekker uendelig med utvalg. Vi er interessert i en Bootstrapmetode for å estimere variansen til ˆ ( / ) Y = y x. Det finnes en s s del metoder for denne typen estimatorer men de bygger alle på et enkelt tilfeldig utvalg. Hvis vi benytter en av disse metodene får vi antakeligvis en estimator som er lite egnet for å estimere variansen til Y ˆ. Det er også beskrevet noen Bootstrapmetoder som tar for seg situasjonen med ulike trekksannsynligeter (Rao og Wu 1988 og Sitter 199). Men disse metodene er beregnet på en annen type estimator en den vi ar. Vi ar ikke funnet en metode som kombinerer ulike trekksannsynligeter med vår type estimator. 15

17 6. Modellbasert analyse av estimert diffusjonsindeks I dette avsnittet skal vi gjøre en modellbasert analyse av ˆd. Dvs. at vi nå ser på bransjeenetenes konjunktursysselsettinger som stokastiske variabler mens utvalget antas gitt. Dermed er det ikke bare Y ˆ 'ene og ˆd som er stokastiske men også Y 'ene og d. Dette betyr at vi skal anslå eller predikere verdien til en stokastisk variabel. Av den grunn kalles gjerne Y ˆ 'ene og ˆd for prediktorer. Som i forrige avsnitt ser vi bort fra frafall målefeil og registerfeil og vi tenker oss at vi ar utvalg fra alle strata. Fordi et utvalg vanligvis trekkes stokastisk kan det kanskje virke litt rart at vi nå skal se på utvalget som gitt og i stedet anta en modell for populasjonsvariablene. Men å anta en modell for populasjonsvariablene er ikke noe nytt. Veldig ofte velges estimatoren og utvalgsplanen på bakgrunn av blant annet en slik antagelse om vordan populasjonsvariablene fordeler seg. Videre ar vi spesielt for konjunkturbarometeret at det samme utvalget benyttes over en lengre periode på minst fire kvartal. For vert kvartal observeres det nye verdier for konjunktursysselsettingen til de utvalgte bransjeenetene. Derfor er det meningsfylt å gjøre en analyse der vi ser på utvalget som gitt og konjunktursysselsettingene som stokastiske variabler som følger en fordeling. Vi kan også argumentere for modelleringen ved jelp av Likelioodprinsippet (LP). LP sier at to proporsjonale likelioodfunksjoner skal gi samme statistiske analyse og fører til at vi må foreta en modellering av populasjonen for å kunne utføre en informativ analyse. (For mer om LP se Bjørnstad 1995). Nå ser vi altså på y i som en stokastisk variabel som kan anta verdiene x i x i / og 0. Vi lar p s p u og p m være sannsynligetene for at y i inntar disse verdiene respektivt. Dvs. at p s er sannsynligeten for at yi = xi altså at bransjeeneten forventer en økning i produksjonen p u er sannsynligeten for at yi = xi / altså at bransjeeneten ikke forventer noen endring og p m er sannsynligeten for at y i = 0 altså at bransjeeneten forventer en nedgang. Vi finner at forventningen og variansen til y i enoldsvis kan skrives som og E i y = βx i xi V( y ) =σ i der β = p + ( 1/) p og ( 1/4) ( 1/) s u σ = p + p p + p. s u s u Verdiene til p s p u og p m kan variere fra konjunktursysselsetting til konjunktursysselsetting. Men fordi bransjeeneter innen samme stratum driver innen samme type næring og ar relativt lik sysselsetting er det ikke urimelig å anta at disse sannsynligetene er tilnærmet like for alle konjunktursysselsettingene i stratumet. Dermed vil også β og σ være lik for alle y i i stratumet la oss si β og σ for stratum. Dette gir oss følgende modell som vi vil kalle modell ξ : E y = β x i stratum i i i i V( y ) =σ x i stratum. I resten av dette avsnittet er det denne modellen vi vil anta. I tillegg vil vi anta at konjunktursysselsettingene er uavengige av verandre. 16

18 I populasjonen finnes det noen bransjeeneter som ar sysselsetting x i = 0 dvs. yi = xi = 0. For slike bransjeeneter er ps = pu = pm = 1 og disse sannsynligeten er ikke lik de tilsvarende sannsynligetene for de andre bransjeenetene i stratumet. Dermed older ikke antagelsene som leder til modell ξ for disse bransjeenetene. Men fordi Eyi = 0= βxi og V( yi) = 0 =σ xi når x i = 0 omfatter modellen også disse konjunktursysselsettingene. Vi kan se på ys / x s som en estimator for β og innfører derfor notasjonen slik at y ˆ s β = x Y s = βˆ. ˆ Ved å bruke at utvalget s er gitt finner vi at βˆ E Dermed er og = β. E Yˆ Y β β = = 0 ( Yˆ Y ) E Yˆ Y E d = E 100 = 100 = 0. Fordi dette gjelder for alle utvalg s og alle β og σ ar vi at Y ˆ og ˆd er forventningsrette. I stedet for variansen til ˆd er vi interessert i prediksjonsvariansen dvs. variansen til prediksjonsfeilen ˆd d. Denne kan skrives som ( Yˆ Y ) V( ˆ Y Y) ( ) V ˆ ( d d) = V 100 = 100 der den siste liketen følger av at vi ar uavengiget mellom konjunktursysselsettingene. Vi angir så usikkereten til ˆd med standardavviket 17

19 (16) st ( d) = V ˆ ( d d) V( Yˆ Y) = 100. Før vi estimerer dette standardavviket skal vi gi følgende begrunnelse for å bruke prediksjonsvariansen i stedet for variansen når vi skal angi usikkereten til en prediktor: Anta først at vi klarer å predikere d perfekt dvs. ar en prediktor d = d. Da bør vi a et usikkeretsmål som er null fordi vi er sikre på å predikere d eksakt. Men måler vi usikkereten med variansen til d dvs. V d = V d ar vi et usikkeretsmål som indikerer stor usikkeret vis variansen til d er med stor. Bruker vi derimot prediksjonsvariansen ( d d) V = 0 ar vi et mål som indikerer at det ikke er noen usikkeret akkurat som vi ønsker. Anta nå at vi kjenner forventningen til d og at vi predikerer d med denne dvs. d = Ed. I denne situasjonen ønsker vi et usikkeretsmål som indikerer stor usikkeret vis variansen til d er stor fordi da er vi ikke så sikre på å predikere d bra. Men variansen til d er null selv om variansen til d er stor. Med prediksjonsvariansen V( d d) = V( d) får vi derimot det vi ønsker. Vi skal nå estimere standardavviket (16) og det gjør vi ved å estimere prediksjonsvariansene Y ˆ Y. Ved å benytte at Y ˆ Y = βˆ x y V (17) V( ˆ ) finner vi at i r i i i r x i r i =σ i + i x i s i i s i r Y Y x x der r er alle bransjeenetene i stratum som ikke er med i utvalget. Dermed kan vi estimere prediksjonsvariansen ved å estimere σ. Fra regresjonsteori ar vi at en forventningsrett estimator for der Dermed er 1 1 σ ˆ = ( y β x ) i i n 1 i s xi 1 yi β =. n x i s i σ ˆ + x i r i xi xi x i s i i s i r σ er 18

20 en forventningsrett estimator for (17) (forutsatt at n > 1). Når n = 1 estimerer vi 1 1 σ = β ( y x ) li l li ng g l g i sx l li σ med der g betegner gruppen av strata som ar samme sysselsettingsintervall som stratum n g et antall utvalgte bransjeeneter i denne gruppen og g er antall strata i gruppen. Denne estimatoren vil være forventningsrett for σ dersom Estimatoren for standardavviket (16) er dermed (18) ( d) der ( ˆ V Y Y) st = 100 (19) V ( Yˆ Y) σ l er lik for alle strata l som er med i gruppen. x i i r xi xi n x i s i i s i r σ ˆ + vis > 1 = σ xi + xi vis n = 1 i r i r er en estimator for prediksjonsvariansen (17). I tillegg til å estimere d med estimatoren ˆd kan vi gi et konfidensintervall for d. Vi ar at ˆ ( ) ( ˆ Y Y ) V( ˆ ) d = st d d Y Y. Under visse betingelser på V( Y ˆ Y ) får vi derfor fra Lindebergsetningen at ( d ˆ ) st( d d) er tilnærmet standardnormalfordelt. Et tilnærmet 95% konfidensintervall for d er dermed gitt ved 1.96 st d st d st d for denne og ± ( ). Fordi ( ) er ukjent putter vi inn estimatoren bruker (0) ± 1.96 st ˆ ( d d) som et 95% konfidensintervall for d. 19

21 7. Talleksempel Vi skal nå benytte usikkeretsmålene fra avsnitt 5 og 6 til å estimere usikkereten i konjunkturbarometeret. Perioden vi ser på er kvartal kvartal 000 og 1. og. kvartal 00. Dvs. at vi for disse kvartalene skal angi usikkereten til den estimerte st d ˆ gitt ved (1) og det modellbaserte diffusjonsindeksen med det designbaserte standardavviket standardavviket st ˆ ( d d ) gitt ved (18). Som nevnt skal det ideelt trekkes ett nytt utvalg vert år. Dette er ikke gjort for 000 vilket betyr at utvalget fra 1999 også brukes i 000. I denne tiden det er kun foretatt supplering/rullering av noen få bransjeeneter i enkelte kvartal. F.eks. er utvalget for 1. kvartal 000 supplert med 6 nye bransjeeneter mens 7 bransjeeneter fra forrige kvartals utvalg er fjernet. Frafallet varierer fra kvartal til kvartal og er større i 1999 og 000 enn i 00. I 1999 og 000 varierer frafallet fra 15 til 158 bransjeeneter mens det i 00 er på 84 og 97 bransjeeneter for enoldsvis 1. og. kvartal. Fordi bruttoutvalget ligger på ca. 70 i 1999 og 000 og på ca. 660 for 00 tilsvarer dette et kvartalsvis frafall på omtrent 19% i 1999 og 000 mot ca. 14% i Populasjonen består av ca bransjeeneter. Bransjeenetene er fordelt på ca. 70 strata vorav det skal være fulltelling i ca. 50 (dvs. i de strataene som består av bransjeenetene som ar 300 eller flere sysselsatte). Blant de resterende strataene vor det ikke er fulltelling blir utvalgsenetene fordelt etter en optimal metode. Som nevnt sikrer ikke denne allokeringen av utvalgsenetene at vi får utvalg fra alle strata og i den perioden vi ser på er det ca. 70 strata som ikke ar bruttoutvalg. Hvis vi også teller med de strataene vor vi ar frafall av alle utvalgsenetene ar vi ca. 85 strata uten utvalg (dvs. uten nettoutvalg). Når vi ar beregnet den estimerte diffusjonsindeksen ˆd og standardavvikene st ˆ ( d ) og st ˆ ( d d ) ar vi fjernet fra populasjonen de strataene vor vi ikke ar utvalg. Strengt tatt betyr dette at vi estimerer diffusjonsindeksen til den delmengden av populasjonen vor vi ar utvalg fra. Dette bety også at ˆ st d er usikkeretsmål for ˆd som en estimator for diffusjonsindeksen til denne st ( d ) og delmengden av populasjonen og ikke usikkeretsmål for ˆd som en estimator for diffusjonsindeksen til ele populasjonen. Som stratifiseringsintervall for sysselsettingen bruker vi og 300- for alle næringsovedgrupper selv om noen kan a en litt annen inndeling. Populasjonsdataene for 1999 og 000 som er oldt konstant i disse to årene er aggregert på stratumnivå. Dette betyr at vi ikke får oppgitt ver enkelt bransjeenets sysselsetting men kun den totale sysselsettingen innen vert stratum. Vi kan derfor ikke beregne det modellbaserte standardavviket st ˆ ( d d ) for 1999 og 000 fordi dette standardavviket krever at vi kjenner sysselsettingen til ver enkelt bransjeenet i populasjonen. For 00 derimot er populasjonsdataene på mikronivå dvs. for ver bransjeenet. Vi kan derfor beregne standardavviket st ˆ ( d d ) for 1. og. kvartal Her ar vi regnet en bransjeenet som frafall vis bransjeeneten ikke ar svart på spørsmålet om forventet endring i neste kvartals produksjon selv om bransjeeneten ar svart på andre spørsmål. 0

22 I tillegg til å estimere diffusjonsindeksen for ele populasjonen ar vi estimert diffusjonsindeksen for noen spesielle grupper av strata. De gruppene vi ar sett på kalles for E1 E og E5. Gruppen E1 omfatter innsatsvarer E investeringsvarer og E5 konsumvarer. Vi skulle også a estimert diffusjonsindeksen for gruppen E6. Denne gruppen omfatter energivarer og består av 7 strata som til sammen ar ca. 35 bransjeeneter. Av disse 7 strataene ar vi utvalg fra kun og 3 strata. (3 strata i kvartal 1999 og 1.. kvartal 00 og strata i kvartal 000). Fordi de strataene vor vi ar utvalg fra består av kun en bransjeenet ver dvs. N = 1 ar vi fulltelling i disse strataene. Dermed er den estimerte diffusjonsindeksen ˆd identisk med diffusjonsindeksen for de strataene vor vi ar utvalg fra. Videre får vi at st ( ) = st ˆ ( d d) = 0 og disse usikkeretsmålet er elt korrekt å bruke vis vi er ute etter å estimere diffusjonsindeksen til bare de strataene i gruppen vor vi ar utvalg fra. Men om vi er ute etter å estimere diffusjonsindeksen til ele gruppen vil det være misvisende å angi usikkereten med 0. Av denne grunn ar vi unnlatt å presentere tall for gruppen E6. Estimatene vi ar fått for diffusjonsindeksen det designbaserte standardavviket og konfidensintervallet (15) er gitt i Tabell 1. Hvis vi først ser på de estimerte diffusjonsindeksene og sammenligner disse fra kvartal til kvartal ser vi at samtlige estimater er blitt større fra. til 3. kvartal 1999 mindre fra 3. til 4. kvartal 1999 og så videre ut 000. Eneste unntak er for gruppen E der estimatet er blitt større fra 3. til 4. kvartal 000 mens estimatene for de øvrige gruppene er blitt mindre. Vi ser også at av de i alt 8 estimerte diffusjonsindeksene i 1999 og 000 er 19 estimater større enn 50 mens 9 er mindre enn 50. Spesielt ar vi for gruppen E1 at estimatene er større enn 50 gjennom ele denne perioden. Dette kan tyde på at det gjennomgående ar vært mer optimisme enn pessimisme i populasjonen gjennom 1999 og 000 og at særlig næringene i gruppen E1 ar att gode utsikter. Ser vi nå på de estimerte standardavvikene st ˆ ( d ) i Tabell 1 finner vi at standardavvikene som gjelder for ele populasjonen ligger mellom 1.43 og Ut fra disse tallene kan vi nok si at det er relativt liten usikkeret i estimatoren for diffusjonsindeksen til ele populasjonen. For gruppe E1 og E5 er de estimerte standardavvikene noe større og ligger rundt.40 for E1 og.5 for E5. (Med unntak av. kvartal 00 så er st ˆ ( d ) større for gruppen E1 enn for E5). De største estimerte standardavvikene ar vi for gruppen E. Disse standardavvikene varierer fra 3.0 til 3.64 og tyder på at det er en del usikkeret i estimeringen av diffusjonsindeksen til denne gruppen. Som en følge av at st ˆ ( d ) er blitt minst for ele populasjonen og størst for E er konfidensintervallene i Tabell 1 smalest for populasjonen og videst for gruppe E. 7 Som nevnt er det estimerte standardavviket st ˆ ( d ) blitt mindre for ele populasjonen enn for de andre gruppene. Det er bare gruppen E6 som ar fått et estimert standardavvik som er mindre enn det st d ˆ = 0 for gruppen E6). Faktisk er estimerte standardavviket til ele populasjonen. (Som nevnt er det en sammeneng mellom st ˆ ( d ) til ele populasjonen og til de andre gruppene. Dette følger av at gruppene E1 E E5 og E6 er en partisjon av populasjonen dvs. at gruppene til sammen utgjør ele populasjonen og at det ikke er noen overlapp av strata mellom gruppene. For å se sammenengen lar 7 Fordi vi ikke vet om i y 'ene i populasjonen er slik at den designbaserte forventningsskjeveten til ˆd er tilnærmet 0 vet vi eller ikke om disse konfidensintervallene kan sees på som 95% konfidensintervall. 1

23 vi d p d 1 d d 5 og d 6 stå for diffusjonsindeksen til ele populasjonen og til gruppe E1 E E5 og E6 respektivt. Vi lar så d ˆp ˆd 1 ˆd ˆd 5 og ˆd 6 stå for de tilsvarende estimatorene. Med denne notasjonen kan kvadratet av det estimerte standardavviket til populasjonen skrives som st st st st st p p p p (1) ( ˆ 1 ) ( ˆ ) ( ˆ 5 ) 6 ( ˆ d ) 1 5 ( ˆ p = d + d + d + d6) der p 1 5 og 6 står for den total sysselsetting i enoldsvis populasjonen gruppe E1 E E5 og E6. Fordi i / p i= 156 alltid er mindre enn 1 vil vi ofte få at det estimerte standardavviket for ele populasjonen er mindre en det estimerte standardavviket for en gruppe. En tilsvarende sammeneng som (1) gjelder også for det modellbaserte estimerte standardavviket st d. (Men fordi vi slår sammen flere strata ved estimeringen av prediksjonsvariansen til Y ˆ når n = 1< N og dermed bruker vi flere strata når vi ser på ele populasjonen enn når vi ser på en gruppe er sammenengen ikke elt eksakt for st ˆ ( d d )). Dermed vil vi ofte få at også st ˆ ( d d ) er mindre for ele populasjonen enn for gruppene. Tallene vi ar fått for det modellbaserte standardavviket st ˆ ( d d ) og det modellbaserte konfidensintervallet (0) er vist i Tabell. I 1. kvartal 00 er de estimerte standardavvikene blitt og 1.69 for enoldsvis populasjonen gruppen E1 E og E5. I. kvartal 00 er de tilsvarende estimatene blitt og.17. Det estimerte standardavviket er som vi ser mindre for ele populasjonen enn for gruppene som ventet. (Det eneste unntaket er gruppen E6 som ar et estimert standardavvik på 0). Videre er st ˆ ( d d ) størst for gruppen E5. Som en følge av dette ar vi fått de smaleste konfidensintervallene for diffusjonsindeksen til ele populasjonen og de videste konfidensintervallene for diffusjonsindeksen til gruppen E5. Det designbaserte standardavviket st ˆ ( d ) og det modellbaserte standardavviket st ˆ ( d d ) måler ikke den samme usikkereten. Usikkereten som st ˆ ( d ) måler kommer av at det er flere mulige utvalg som kan trekkes mens usikkereten som st ˆ ( d d ) måler kommer av at y i 'ene antas å være stokastiske variabler som kan anta flere verdier. Hvis vi sammenligner estimatene vi ar fått for disse to st d st d ˆ. Dette kan tyde på at standardavvikene ser vi at estimatene er mindre for ( ) enn for usikkereten som måles med st ˆ ( d d ) er mindre enn usikkereten som måles med ˆ vi ar brukt konservative estimatorer for V( Y ˆ ) ved estimeringen av ˆ usikkeretene som måles med de to standardavvikene relativt like. st d. Men fordi st d er det også mulig at Som vi ar nevnt er ikke ˆd designforventningsrett. For å få tall på vor stor forventningsskjeveten kan bli på det verste ar vi beregnet den nedre og øvre grensen fra underavsnitt 5.1. Dette gav oss den

24 nedre grensen og den øvre grensen 19.3 i 1. og. kvartal (Fordi vi trenger sysselsettingen til ver bransjeenet for å beregne grensene kan vi bare beregne disse for 00). Disse grensene er veldig store. Men det betyr ikke nødvendigvis at forventningsskjevetene for 1. og. kvartal 00 er store det kan godt tenkes at y i 'verdiene for de to kvartalene er slik at forventningsskjevetene er små. For å se vordan forventningsskjeveten blir for ulike konfigurasjoner av y i 'ene ar vi simulert tilfeldige konfigurasjoner. For ver av disse ar vi beregnet den tilnærmede forventningsskjeveten (14) for 1. kvartal 00. Dette gav oss forventningsskjeveter som alle lå mellom og Bare 106 av disse var mindre enn -1 eller større enn 1 mens ele 8030 lå mellom -0.5 og 0.5. Dette indikerer at bare en veldig liten andel av alle mulige konfigurasjoner gir en stor forventningsskjevet og vis de faktiske y i 'ene ikke er en slik konfigurasjon så er forventningsskjeveten veldig liten. Tabell 1: Designbasert standardavvik 8 At den øvre og nedre grensen er blitt like verandre i tallverdi er ikke tilfeldig. Med notasjonen fra underavsnitt 5.1 ar vi at b x = 0. Dette fører til at i U i i b x = b x som igjen gir L= U. c i A i i i i i A 3

25 4

26 Tabell : Modellbasert standardavvik og konfidensintervall 5

27 8. Alternativ estimator: Basert på en korrigert Horvitz- Tompson-estimator Som vi ar sett er ˆd ikke designforventningsrett. Vi skal nå se på en alternativ estimator som for de aller fleste yi -konfigurasjonene ar en mindre forventningsskjevet enn ˆd nemlig estimatoren der Y d = 100 y Y = +β x og i i i s πi i U 1 yi β = n x. i s i Vi kan merke oss at vis i n ( xi / x i U i ) π = for alle i U så er Y =β. Selv om det er ganske få strata vor dette ikke er tilfelle (ca. 9 strata) gjør disse få strataene et stort utslag. F.eks. blir den designbaserte forventningsskjeveten til d merkbart større vis vi bytter ut Y med β i disse strataene. Når U = U blir Y = y / π i s i i dvs. Horvitz-Tompson-estimatoren for Y. Når se på Y som en korrigert Horvitz-Tompson-estimator der vi korrigerer med redusere den designbaserte forventningsskjeveten. For strata der n = 1 ar vi at i xi / x i U i Y = y / x s s Yˆ = y / x. Følgelig er Y = Yˆ når n = 1. π = slik at ar vi fra avsnitt 5 at ( i i ) s s i i βi U U i U kan vi x for å. For de samme strataene Som ved analysene av ˆd tar vi ikke ensyn til frafall registerfeil eller målefeil og vi antar at vi ar utvalg fra alle strata Designbasert analyse I dette underavsnittet skal vi se på d fra et designsynspunkt. Vi starter med å gi en begrunnelse for vorfor vi velger å gjøre en korrigering av Horvitz-Tompson-estimatoren når vi skal estimerer Y. Vi vet at Horvitz-Tompson-estimatoren er forventningsrett når π i > 0 for alle i U. Men når U U fins det i U slik at π i = 0. For disse strataene er Horvitz-Tompson-estimatoren generelt ikke forventningsrett. Forventningen kan skrives som y i E = i sπ i yi i U 6

28 mens forventningsskjeveten er gitt ved y i Bias = i s π i yi. i U Som vi ser er forventningsskjeveten alltid negativ når U U (med mindre i U y i = 0 ). Vi kan si at Horvitz-Tompson-estimatoren systematisk underestimerer Y i disse tilfellene. For å rette opp denne skjeveten estimerer vi y i U i med β i x i og korrigerer Horvitz-Tompsonestimatoren med denne. Dette gir oss vår estimator Y U. Vi ar altså at Y er forventningsrett når U skrives som = U. Generelt for alle strata kan forventningen til Y 1 yi E Y = yi + πi xi. n x i U i U i i U Forventningsskjeveten er dermed 1 yi Bias( Y ) = π x y n xi i U i U i U = b y i i i i U der ( / ) U Når U b = π nx x når i i i i U i = U er EY = Y i i og U er Bias( ) i U og 1 i U i i U i når ellers. (Fordi x = y = 0 Bias Y = 0 som det skal i denne situasjonen). Y generelt ikke lik 0 dvs. at Y generelt ikke er forventningsrett. (Men for de fleste yi -konfigurasjonene ar Y en mindre forventningsskjevet enn Horvitz-Tompsonestimatoren). Dermed er d ikke forventningsrett. Men det viser seg ved simulering av tilfeldige yi - konfigurasjoner at forventningsskjeveten til d som oftest er veldig liten (vi skal se tall på dette i underavsnitt 8.3). Det viser seg også at forventningsskjeveten til d som oftest er mindre enn forventningsskjeveten til ˆd. Vi skal nå finne en grense for vor stor forventningsskjeveten til d kan bli. Fordi Y = Y når n = N kan forventningsskjeveten skrives som 7

29 ( d ) s.a. n< N Bias s.a. n< N i U ( Y ) Bias = 100 = 100. b y Ved å benytte uliketen Bias der ( d ) L Bias U < s.a. n N i U i U L = 100 i i x Y x får vi x i i i i U og < s.a. n N i U U = 100. x i Dermed er L en nedre og U en øvre grense for Bias( d ). Som vi skal se i underavsnitt 8.3 er disse grensene en god del mindre enn de tilsvarende grensene for Bias ˆ ( d ) men de er allikevel store. Standardavviket til d er gitt ved der V( ) ( d ) V( Y ) st = 100 Y er variansen til denne variansen kan skrives som V Y. Ved å benytte at = ( 1/ π + ( )/ i s ) i U 1 ( Y ) = ( πiπj πij )( vi vj ) i U j U j i der ( 1/ ( ) / i U ) v = π + x n x y. i i i i i Y x n x y får vi at i i i i 8

30 Vi estimerer standardavviket til d ved å estimere variansen til Y 'ene. Når n = 1 klarer vi ikke V Y på vanlig måte. I disse tilfellene benytter vi derfor en øvre grense som en estimere variansen ( ) konservativ estimator og vi ar valgt å bruke den samme grensen som vi benyttet for variansen til Y ˆ i avsnitt 5 dvs. /4. (Husk at Y ˆ = Y når n = 1 ). Når n > 1 estimerer vi variansen med 1 π π πˆ πˆ i j ij () ˆV SYG Y = vi vj der i s j s j i ij π i når i = j N( n π ˆ ij = π når 1 og 1 iπj i j πi πj n( N 1) π i π j når i j og π i eller π j = 1. Estimatoren for standardavviket til d er dermed gitt ved (3) ( d ) der ˆV( Y ) st = 100 og ˆV SYG ( ) 0 når n = N 1 ˆV ( Y ) når n 1 N 4 ˆV SYG ( Y ) når 1< n < N = = < Y er gitt ved (). Hvis y i 'ene er slik at forventningsskjeveten til d er tilnærmet 0 kan vi finne et tilnærmet 95% konfidensintervall for d. Fremgangsmåten er den samme som for det designbaserte konfidensintervallet i underavsnitt 5.1 og konfidensintervallet vi ender opp med er. (4) d ± 1.96 st ( d ) Hvis vi gjør en sammenligning av estimatorene d og ˆd ut fra et designsynspunkt ar vi at ingen av estimatorene er forventningsrette. Men det viser seg at d for de fleste yi -konfigurasjonene ar en 9

31 noe mindre forventningsskjevet enn ˆd. Hvis standardavviket til d alltid er mindre enn standardavviket til ˆd vil vi derfor foretrekke estimatoren d fremfor ˆd. Men vi ar dessverre ikke klart å sammenligne standardavvikene til d og ˆd. Hvis vi i stedet sammenligner de estimerte verdiene vi ar fått for disse standardavvikene finner vi at de er ganske like verandre. (Talleksempel st d ˆ er mer eller med estimater for st ( d ) er gitt i underavsnitt 8.3). Dette kan tyde på at st ( d ) og mindre like verandre uten at vi kan si dette sikkert. Det ser dermed ikke ut til å være noen stor gevinst ved å bytte ut den etablerte estimatoren ˆd med d. 8.. Modellbasert analyse Vi skal nå gjøre en modellbasert analyse av d under modellen ξ fra avsnitt 6. Dvs. at vi nå ser på utvalget som gitt mens vi antar følgende: E y = β x i stratum i i i i V( y ) =σ x i stratum og uavengiget mellom y i 'ene. Med disse antagelsene viser det seg at slik at E Y Y = 0 E Y Y E d d = 100= 0 dvs. at d er en forventningsrett estimator for d. 9 Som begrunnet i avsnitt 6 måles usikkereten til en prediktor med standardavviket til prediksjonsfeilen fremfor standardavviket til selve prediktoren. Vi måler derfor usikkereten til d med standardavviket til d d. Dette standardavviket er gitt ved 9 At Y er forventningsrett kan vises på følgende måte: For strata vor n x / 30 π = x i i i U i i U er Y = / n yi / x i s i. Av dette følger det at E Y Y = 0. For strata vor nx i / x 1 i U i > for noen i la oss si for i s1 er π i = 1 for i s1 π i = n s 1 xi / xi for i U \ s1 og i U \1 s / / Dermed er = + ( ) 1 ( \ 1 ) + \ 1 (fordi. Y y n s y x x n y x x i s i i s s i i i U s i i i i s i U i 1 Y Y =. i s alltid er med i utvalget). Av dette følger det at E 0

32 ( d d) V( Y Y) st = 100. og vi estimerer det ved å estimere prediksjonsvariansene V( Y Y ) Ved å benytte at 1 x Y Y y y finner vi at i U i = + 1 i i i s π i nx i i r 1 x i U i V( Y Y ) =σ 1 + xi + xi i s i nx π. i i r Dermed kan vi estimere prediksjonsvariansen til Y ved å estimere som i avsnitt 6 kan vi bruke den samme estimatoren for med når n > 1 og 1 1 σ ˆ = β ( y x ) i i n i s xi σ = β ( y x ) li l li ng g l g i sxli l σ. Fordi vi bruker samme modell σ som i avsnitt 6. Vi estimerer dermed når n = 1. (Her er g gruppen av strata som ar samme sysselsettingsintervall som stratum og n g er antall utvalgte bransjeeneter i denne gruppen). Som nevnt i avsnitt 6 er σ ˆ en forventningsrett estimator for σ under den antatte modellen mens σ er forventningsrett dersom strata l som ar samme sysselsettingsintervall som stratum. Estimatoren for standardavviket blir dermed ˆV( Y Y) st = 100 (5) ( d d) σ σ l er lik for alle der V ( Y Y) 1 x i U i xi xi n i s i nx π i i r σ ˆ vis > 1 = 1 x i U i σ + 1 xi + xi vis n = 1. i s i nx i π i r 31

Kvartalsvis ordrestatistikk for industrien

Kvartalsvis ordrestatistikk for industrien Notater Documents 24/2012 Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk for industrien Dokumentasjon av estimatoren Notater 24/2012 Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk

Detaljer

Varehandels statistikken. Ny estimeringsmetode alternativ metode. og noen generelle kommentarer. av Hans Olav Egede Larssen.

Varehandels statistikken. Ny estimeringsmetode alternativ metode. og noen generelle kommentarer. av Hans Olav Egede Larssen. IO 651 Oslo, 16. november 1965 Vareandels statistikken Ny estimeringsmetode 1963 - alternativ metode og noen generelle kommentarer av Hans Olav Egede Larssen Innold 1. En brøkestimat-variant av "korrigerte

Detaljer

03/28 Notater Anna-Karin Mevik. Usikkerhet i konjunktur barometeret. Seksjon for statistiske metoder og standarder Emnegruppe: 08.

03/28 Notater Anna-Karin Mevik. Usikkerhet i konjunktur barometeret. Seksjon for statistiske metoder og standarder Emnegruppe: 08. 03/28 Notater 2003 Anna-Karin Mevik Usikkerhet i konjunktur barometeret Seksjon for statistiske metoder og standarder Emnegruppe: 08.90 Innhold MB Bana oepotbiblioteket 1. Innledning 3 2. Populasjon 3

Detaljer

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1

Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom << >>. Oppgave 1 ECON 0 EKSMEN 007 VÅR SENSORVEILEDNING Oppgaven består av 9 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom >. Oppgave. La begivenhetene BC,, være slik at og

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010

Utfordring. TMA4240 Statistikk H2010. Mette Langaas. Foreleses uke 40, 2010 TMA4240 Statistikk H2010 Statistisk inferens: 8.1: Tilfeldig utvalg 9.1-9.3: Estimering Mette Langaas Foreleses uke 40, 2010 2 Utfordring Ved en bedrift produseres en elektrisk komponent. Komponenten må

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer

Detaljer

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>. ECON 0 EKSAMEN 0 VÅR TALLSVAR Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i

Detaljer

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Løsningsforslag til andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Oppgave 1 a Forventet antall dødsulykker i år i er E(X i λ i. Dermed er θ i λ i E(X i forventet antall dødsulykker per 100

Detaljer

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2

betyr begivenheten at det blir trukket en rød kule i første trekning og en hvit i andre, mens B1 B2 ECON30: EKSAMEN 06v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i

Detaljer

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind

Forelesning 6: Punktestimering, usikkerhet i estimering. Jo Thori Lind Forelesning 6: Punktestimering, usikkerhet i estimering Jo Thori Lind j.t.lind@econ.uio.no Oversikt 1. Trekke utvalg 2. Estimatorer og observatorer som stokastiske variable 3. Egenskapene til en estimator

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet

Detaljer

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader.

j=1 (Y ij Ȳ ) 2 kan skrives som SST = i=1 (J i 1) frihetsgrader. FORMELSAMLING TIL STK2120 (Versjon av 30. mai 2012) 1 Enveis variansanalyse Anta at Y ij = µ + α i + ɛ ij ; j = 1, 2,..., J i ; i = 1, 2,..., I ; der ɛ ij -ene er uavhengige og N(0, σ 2 )-fordelte. Da

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i <<< >>>. 1 ECON213: EKSAMEN 217 VÅR - UTSATT PRØVE TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig

Detaljer

TMA4240 Statistikk Høst 2018

TMA4240 Statistikk Høst 2018 TMA4240 Statistikk Høst 2018 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 5 Dette er andre av tre innleveringer i blokk 2. Denne øvingen skal oppsummere pensum

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - "Fornuftig verdi"

Inferens. STK Repetisjon av relevant stoff fra STK1100. Eksempler. Punktestimering - Fornuftig verdi Inferens STK1110 - Repetisjon av relevant stoff fra STK1100 Geir Storvik 12. august 2015 Data x 1,..., x n evt også y 1,..., y n Ukjente parametre θ kan være flere Vi ønsker å si noe om θ basert på data.

Detaljer

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen

Høgskolen i Telemark. Institutt for økonomi og informatikk FORMELSAMLING Statistikk I. Til bruk ved eksamen. Per Chr. Hagen Høgskolen i Telemark Institutt for økonomi og informatikk FORMELSAMLING 6005 Statistikk I Til bruk ved eksamen Per Chr. Hagen . Sannsynlighetsregning. Regneregler Komplementsetningen: Addisjonssetningen:

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamen i: ECON30 Statistikk UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 03.06.06 Sensur kunngjøres: 4.06.06 Tid for eksamen: kl. 09:00 :00 Oppgavesettet er på 5 sider Tillatte hjelpemidler:

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger

Detaljer

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere

Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Utsatt eksamen i: ECON130 Statistikk 1 UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Eksamensdag: 1306017 Sensur kunngjøres senest: 3006017 Tid for eksamen: kl 09:00 1:00 Oppgavesettet er på 5 sider Tillatte

Detaljer

Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk for industrien Dokumentasjon av estimatoren

Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk for industrien Dokumentasjon av estimatoren tø Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk for industrien Dokumentasjon av estimatoren Notater 24/2012 Anna-Karin Mevik og Robert Skotvold Kvartalsvis ordrestatistikk for industrien

Detaljer

STK Oppsummering

STK Oppsummering STK1100 - Oppsummering Geir Storvik 6. Mai 2014 STK1100 Tre temaer Deskriptiv/beskrivende statistikk Sannsynlighetsteori Statistisk inferens Sannsynlighetsregning Hva Matematisk verktøy for å studere tilfeldigheter

Detaljer

Bootstrapping og simulering Tilleggslitteratur for STK1100

Bootstrapping og simulering Tilleggslitteratur for STK1100 Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 (oppdatert April 2016) 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor

Detaljer

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister.

Merk at vi for enkelthets skyld antar at alle som befinner seg i Roma sentrum enten er italienere eller utenlandske turister. ECON230: EKSAMEN 20 VÅR - UTSATT PRØVE 2 TALLSVAR. Oppgave Da Anne var på besøk i Roma, fikk hun raskt problemer med språket. Anne snakker engelsk, men ikke italiensk, og kun av 5 italienere behersker

Detaljer

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk

Tilfeldige variabler. MAT0100V Sannsynlighetsregning og kombinatorikk MAT0100V Sannsynlighetsregning og kombinatorikk Forventning, varians og standardavvik Tilnærming av binomiske sannsynligheter Konfidensintervall Ørnulf Borgan Matematisk institutt Universitetet i Oslo

Detaljer

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Jarle Tufto Tlf: 99 70 55 19 Eksamensdato: 3. desember 2016 Eksamenstid (fra til): 09:00-13:00

Detaljer

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>.

TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i << >>. 1 ECON130: EKSAMEN 014 VÅR - UTSATT PRØVE TALLSVAR. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variason i vanskelighetsgrad. Svarene er gitt i >. Oppgave 1 Fra en eldre

Detaljer

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer.

Utvalgsfordelinger. Utvalg er en tilfeldig mekanisme. Sannsynlighetsregning dreier seg om tilfeldige mekanismer. Utvalgsfordelinger Vi har sett at utvalgsfordelinger til en statistikk (observator) er fordelingen av verdiene statistikken tar ved mange gjenttatte utvalg av samme størrelse fra samme populasjon. Utvalg

Detaljer

Kapittel 4.4: Forventning og varians til stokastiske variable

Kapittel 4.4: Forventning og varians til stokastiske variable Kapittel 4.4: Forventning og varians til stokastiske variable Forventning og varians til stokastiske variable Histogrammer for observerte data: Sannsynlighets-histogrammer og tetthetskurver for stokastiske

Detaljer

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47)

Oppgave 1. . Vi baserer oss på at p 47 1 og p 2 er tilnærmet normalfordelte (brukbar tilnærming). Vi har tilnærmet at (n 1 = n 2 = 47) MOT310 tatistiske metoder 1 Løsningsforslag til eksamen vår 006, s. 1 Oppgave 1 a) En tilfeldig utvalgt besvarelse får F av sensor 1 med sannsynlighet p 1 ; resultatene for ulike besvarelser er uavhengige.

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Tenkeonsdag i MAT-INF 1100 Modellering og beregninger. Dag: Onsdag 28. november 2012. Tid for moroa: 16:00 19:00. Oppgavesettet er på 9

Detaljer

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y

Løsningsforslag. n X. n X 1 i=1 (X i X) 2 og SY 2 = 1 ny S 2 X + S2 Y Statistiske metoder 1 høsten 004. Løsningsforslag Oppgave 1: a) Begge normalplottene gir punkter som ligger omtrent på ei rett linje så antagelsen om normalfordeling ser ut til å holde. Konfidensintervall

Detaljer

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011

LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A

Detaljer

TMA4240 Statistikk Eksamen desember 2015

TMA4240 Statistikk Eksamen desember 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik

Detaljer

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i.

Seminaroppgave 10. (a) Definisjon: En estimator θ. = θ, der n er et endelig antall. observasjoner. Forventningsretthet for β: Xi X ) Z i. Seminaroppgave 0 a Definisjon: En estimator θ n er forventningsrett hvis E θn observasjoner. Forventningsretthet for β: θ, der n er et endelig antall β Xi X Y i Xi X Xi X α 0 + βx i + n Xi X Xi X β + Xi

Detaljer

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X

Da vil summen og gjennomsnittet være tilnærmet normalfordelte : Summen: X 1 +X X n ~N(nµ,nσ 2 ) Gjennomsnittet: X 1 +X Me me me me metallic hvit 4.4: Tilnærming til normalfordeling Tilnærming til normalfordeling: binomisk og Poisson kan tilnærmes v.h.a. normalfordeling under bestemte forhold (ved "mange" delforsøk/hendelser)

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 0, blokk II Løsningsskisse Oppgave Surhetsgrad i ferskvann Eksamen august 00, oppgave av 3 a) En god estimator

Detaljer

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår

Løsningsforslag ECON 2130 Obligatorisk semesteroppgave 2017 vår Løsningsforslag ECON 130 Obligatorisk semesteroppgave 017 vår Andreas Myhre Oppgave 1 1. (i) Siden X og Z er uavhengige, vil den simultane fordelingen mellom X og Z kunne skrives som: f(x, z) = P(X = x

Detaljer

ECON2130 Kommentarer til oblig

ECON2130 Kommentarer til oblig ECON2130 Kommentarer til oblig Her har jeg skrevet ganske utfyllende kommentarer til en del oppgaver som mange slet med. Har noen steder gått en del utover det som det strengt tatt ble spurt om i oppgaven,

Detaljer

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1

Oppgaven består av 10 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom <<. >>. Oppgave 1 ECON 0 EKSAMEN 004 VÅR SENSORVEILEDNING Oppgaven består av 0 delspørsmål som anbefales å veie like mye. Kommentarer og tallsvar er skrevet inn mellom

Detaljer

Anna-Karin Mevik. Estimering av månedlig omsetning innenfor bergverksdrift og industri. 2008/57 Notater. 1_ c .52. rc +»

Anna-Karin Mevik. Estimering av månedlig omsetning innenfor bergverksdrift og industri. 2008/57 Notater. 1_ c .52. rc +» 2008/57 Notater «0 o z W» u 3 V) (0 Anna-Karin Mevik Irt Estimering av månedlig omsetning innenfor bergverksdrift og industri ofl >».Q 1_ c.52 rc» Stabsavdelingen/Seksjon for statistiske metoder og standarder

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1100 Statistiske metoder og dataanalyse 1 - Løsningsforslag Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30

Detaljer

10.1 Enkel lineær regresjon Multippel regresjon

10.1 Enkel lineær regresjon Multippel regresjon Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel

Detaljer

Tilleggsoppgaver for STK1110 Høst 2015

Tilleggsoppgaver for STK1110 Høst 2015 Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0

Detaljer

TMA4245 Statistikk Eksamen desember 2016

TMA4245 Statistikk Eksamen desember 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 Ei bedrift produserer elektriske komponentar. Komponentane kan ha to typar

Detaljer

TMA4240 Statistikk 2014

TMA4240 Statistikk 2014 TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten

Detaljer

Fasit for tilleggsoppgaver

Fasit for tilleggsoppgaver Fasit for tilleggsoppgaver Uke 5 Oppgave: Gitt en rekke med observasjoner x i (i = 1,, 3,, n), definerer vi variansen til x i som gjennomsnittlig kvadratavvik fra gjennomsnittet, m.a.o. Var(x i ) = (x

Detaljer

Ridge regresjon og lasso notat til STK2120

Ridge regresjon og lasso notat til STK2120 Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle

Detaljer

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.

Oppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2. Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir

Detaljer

STK Oppsummering

STK Oppsummering STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer

Detaljer

Løsningsforslag til obligatorisk oppgave i ECON 2130

Løsningsforslag til obligatorisk oppgave i ECON 2130 Andreas Mhre April 15 Løsningsforslag til obligatorisk oppgave i ECON 13 Oppgave 1: E(XY) = E(X(Z X)) Setter inn Y = Z - X E(XY) = E(XZ X ) E(XY) = E(XZ) E(X ) E(XY) = - E(X ) X og Z er uavhengige, så

Detaljer

Kort overblikk over kurset sålangt

Kort overblikk over kurset sålangt Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente

Detaljer

Løsningsforslag: STK2120-v15.

Løsningsforslag: STK2120-v15. Løsningsforslag: STK2120-v15 Oppgave 1 a) Den statistiske modellen er: X ij = µ i + ϵ ij, j = 1,, J, i = 1,, I Her indekserer i = 1,, I gruppene og j = 1,, J observasjone innen hver gruppe Feilleddene

Detaljer

Kraftelektronikk (Elkraft 2 høst), øvingssett 1, høst 2005

Kraftelektronikk (Elkraft 2 høst), øvingssett 1, høst 2005 Kraftelektronikk (Elkraft 2 øst), øvingssett, øst 2005 OleMorten Midtgård HiA 2005 Ingen innlevering. Det gis veiledning tirsdag 23. og tirsdag 30. august. Utvalgte oppgaver blir gjennomgått tirsdag 6.

Detaljer

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].

(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)

Detaljer

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider

L12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider Page 76 of 80 L12-Dataanalyse Introduksjon Introduksjon til dataanalyse Presentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF,, osv) i modeller vi benytter for vedlikeholdsoptimering

Detaljer

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2

Ferdig før tiden 4 7 Ferdig til avtalt tid 12 7 Forsinket 1 måned 2 6 Forsinket 2 måneder 4 4 Forsinket 3 måneder 6 2 Forsinket 4 måneder 0 2 Besvar alle oppgavene. Hver deloppgave har lik vekt. Oppgave I En kommune skal bygge ny idrettshall og vurderer to entreprenører, A og B. Begge gir samme pristilbud, men kommunen er bekymret for forsinkelser.

Detaljer

HØGSKOLEN I STAVANGER

HØGSKOLEN I STAVANGER EKSAMEN I: MOT0 STATISTISKE METODER VARIGHET: TIMER DATO:. NOVEMBER 00 TILLATTE HJELPEMIDLER: KALKULATOR, TABELLER OG FORMLER I STATISTIKK (TAPIR FORLAG) OPPGAVESETTET BESTÅR AV OPPGAVER PÅ 7 SIDER HØGSKOLEN

Detaljer

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT

UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Utsatt eksamen i: ECON2130 - Statistikk 1 Eksamensdag: 19.06.2014 Tid for eksamen: kl. 09:00 12:00 Oppgavesettet er på 4 sider UNIVERSITETET I OSLO ØKONOMISK INSTITUTT Tillatte hjelpemidler: Alle trykte

Detaljer

Eksamensoppgave i TMA4240 Statistikk

Eksamensoppgave i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid

Detaljer

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio)

Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Datamatrisen: observasjoner, variabler og verdier. Variablers målenivå: Nominal Ordinal Intervall Forholdstall (ratio) Beskrive fordelinger (sentraltendens, variasjon og form): Observasjon y i Sentraltendens

Detaljer

STK1100 våren 2019 Mere om konfidensintevaller

STK1100 våren 2019 Mere om konfidensintevaller STK1100 våren 2019 Mere om konfidensintevaller Svarer til avsnitt 8.2 i læreboka Ørnulf Borgan Matematisk institutt Universitetet i Oslo 1 Konfidensintervall for µ i store utvalg Anta at de stokastiske

Detaljer

Bootstrapping og simulering

Bootstrapping og simulering Bootstrapping og simulering Tilleggslitteratur for STK1100 Geir Storvik April 2014 1 Introduksjon Simulering av tilfeldige variable (stokastisk simulering) er et nyttig verktøy innenfor statistikk, men

Detaljer

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25

A. i) Sett opp en frekvenstabell over de fire mulige kombinasjonene av kjønn og røykestatus. Dvs. fyll inn. Ikke - røyker Sum Jente Gutt Sum 25 1 ECON21: ESAEN 215v SENSORVEILEDNING. Det anbefales at de 9 deloppgavene merket med A, B, teller likt uansett variasjon i vanskelighetsgrad. Svarene er gitt i > Grensen til bestått bør ligge på ca

Detaljer

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010

Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Andre sett med obligatoriske oppgaver i STK1110 høsten 2010 Dette er det andre settet med obligatoriske oppgaver i STK1110 høsten 2010. Oppgavesettet består av fire oppgaver. Det er valgfritt om du vil

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i MAT-INF 1100 Modellering og beregninger. Eksamensdag: Fredag 7. januar 2005. Tid for eksamen: 14:30 17:30. Oppgavesettet er på

Detaljer

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x

I enkel lineær regresjon beskrev linja. μ y = β 0 + β 1 x Multiple regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable.det er fortsatt en responsvariabel. Måten dette gjøre på er nokså naturlig. Prediktoren

Detaljer

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter

for x 0 F X (x) = 0 ellers Figur 1: Parallellsystem med to komponenter Figur 2: Seriesystem med n komponenter TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3, blokk II Dette er den første av to innleveringer i blokk 2. Denne øvingen skal oppsummere

Detaljer

Eksamensoppgåve i TMA4240 Statistikk

Eksamensoppgåve i TMA4240 Statistikk Institutt for matematiske fag Eksamensoppgåve i TMA4240 Statistikk Fagleg kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806

Detaljer

Løsningsforslag, eksamen statistikk, juni 2015

Løsningsforslag, eksamen statistikk, juni 2015 Løsningsforslag, eksamen statistikk, juni 0 Oppgave 1 Siden det spørres om tall fra et intervall, som oppgaven viser kan være et reelle, er det tydelig at tallene er tatt fra en kontinuerlig fordeling.

Detaljer

Hypotesetesting. mot. mot. mot. ˆ x

Hypotesetesting. mot. mot. mot. ˆ x Kapittel 6.4-6.5: ypotesetesting ypotesetesting er en standard vitenskapelig fremgangsmåte for å sjekke påstander. Generell problemstilling: Basert på informasjonen i data fra et tilfeldig utvalg ønsker

Detaljer

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag

TMA4245 Statistikk. Innlevering 3. Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Vår 2017 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 3 Dette er den første av to innleveringer i blokk 2 Denne øvingen skal oppsummere pensum

Detaljer

Løsningsforslag eksamen 25. november 2003

Løsningsforslag eksamen 25. november 2003 MOT310 Statistiske metoder 1 Løsningsforslag eksamen 25. november 2003 Oppgave 1 a) Vi har µ D = µ X µ Y. Sangere bruker generelt trapesius-muskelen mindre etter biofeedback dersom forventet bruk av trapesius

Detaljer

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002

Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Løsningsforslag Eksamen i Statistikk SIF5060 Aug 2002 Oppgave 1 a) En god estimator er forventningsrett og har liten varians. Vi tester forventningsretthet: E[ˆµ] E[Y ] µ E[ µ] E[ 1 2 X + 1 2 Y ] 1 2 E[X]

Detaljer

Prøveeksamen STK2100 (fasit) - vår 2018

Prøveeksamen STK2100 (fasit) - vår 2018 Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen

Detaljer

Mat503: Regneøving 3 - løsningsforslag

Mat503: Regneøving 3 - løsningsforslag Mat503: Regneøving 3 - løsningsforslag Oppgave a) Oppgaven sier at Fredrik stoler på erfaringen sin med positive ele tall. Fredrik ar sannsynligvis sett at dersom an ar et elt tall k >, vil den oppgitte

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis

Detaljer

Om eksamen. Never, never, never give up!

Om eksamen. Never, never, never give up! I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.

Detaljer

TMA4240 Statistikk Høst 2009

TMA4240 Statistikk Høst 2009 TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave

Detaljer

Kp. 9.8 Forskjell mellom to forventninger

Kp. 9.8 Forskjell mellom to forventninger andeler I analysene skal vi se på situasjonene der σx og σ Y er kjente; normalantakelse a σx og σ Y er ukjente men σ X = σ Y ; normalantakelse og b σx og σ Y er ukjente og σ X σ Y ; normalantakelse 3 og

Detaljer

Notat 3 - ST februar 2005

Notat 3 - ST februar 2005 Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk

Detaljer

Oppgave 1: Feil på mobiltelefoner

Oppgave 1: Feil på mobiltelefoner Oppgave 1: Feil på mobiltelefoner a) Sannsynlighetene i oppgaven blir P (F 1 F 2 ) P (F 1 ) + P (F 2 ) P (F 1 F 2 ) P (F 1 ) + 1 P (F2 C ) P (F 1 F 2 ) 0.080 + 0.075 0.006 0.149 P (F 1 F 2 ) P (F 1 F 2

Detaljer

Tallfølger er noe av det første vi treffer i matematikken, for eksempel når vi lærer å telle.

Tallfølger er noe av det første vi treffer i matematikken, for eksempel når vi lærer å telle. Kapittel 1 Tallfølger 1, 2, 3, 4, 5, 6, 7, 8,... Det andre temaet i kurset MAT1001 er differenslikninger. I en differenslikning er den ukjente en tallfølge. I dette kapittelet skal vi legge grunnlaget

Detaljer

ST0202 Statistikk for samfunnsvitere

ST0202 Statistikk for samfunnsvitere ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,

Detaljer

TMA4240 Statistikk Høst 2015

TMA4240 Statistikk Høst 2015 TMA4240 Statistikk Høst 2015 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 9, blokk II Oppgave 1 X er kontinuerlig fordelt med sannsynlighetstetthet f(x) = 2xe

Detaljer

Kapittel 3: Studieopplegg

Kapittel 3: Studieopplegg Oversikt over pensum Kapittel 1: Empirisk fordeling for en variabel o Begrepet fordeling o Mål for senter (gj.snitt, median) + persentiler/kvartiler o Mål for spredning (Standardavvik s, IQR) o Outliere

Detaljer

6.2 Signifikanstester

6.2 Signifikanstester 6.2 Signifikanstester Konfidensintervaller er nyttige når vi ønsker å estimere en populasjonsparameter Signifikanstester er nyttige dersom vi ønsker å teste en hypotese om en parameter i en populasjon

Detaljer

Inferens i fordelinger

Inferens i fordelinger Inferens i fordelinger Modifiserer antagelsen om at standardavviket i populasjonen σ er kjent Mer kompleks systematisk del ( her forventningen i populasjonen). Skal se på en situasjon der populasjonsfordelingen

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 101 Innføring i statistikk og sannsynlighetsregning. Eksamensdag: Mandag 30. november 1992. Tid for eksamen: 09.00 15.00.

Detaljer

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1

Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s. 1. Oppgave 1 Matematisk statistikk og stokastiske prosesser B, høsten 2006 Løsninger til oppgavesett 5, s AR2-modell: Oppgave X t φ X t φ 2 X t 2 Z t Antas å være kausal slik at X t ψ j Z t j er ukorrelert med Z t+,

Detaljer

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere Kap. 10: Inferens om to populasjoner Situasjon: Vi ønsker å sammenligne to populasjoner med populasjonsgjennomsnitt henholdsvis μ 1 og μ. Vi trekker da ett utvalg fra hver populasjon. ST00 Statistikk for

Detaljer

UNIVERSITETET I OSLO

UNIVERSITETET I OSLO UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Løsningsforslag: Statistiske metoder og dataanalys Eksamensdag: Fredag 9. desember 2011 Tid for eksamen: 14.30 18.30

Detaljer

Eksamensoppgave i ST0103 Brukerkurs i statistikk

Eksamensoppgave i ST0103 Brukerkurs i statistikk Institutt for matematiske fag Eksamensoppgave i ST0103 Brukerkurs i statistikk Faglig kontakt under eksamen: Nikolai Ushakov Tlf: 45128897 Eksamensdato: August 2018 Eksamenstid (fra til): 09:00 13:00 Hjelpemiddelkode/Tillatte

Detaljer

TMA4240 Statistikk H2010

TMA4240 Statistikk H2010 TMA4240 Statistikk H2010 Statistisk inferens: 9.14: Sannsynlighetsmaksimeringsestimatoren 8.5: Fordeling til gjennomsnittet 9.4: Konfidensintervall for µ (σ kjent) Mette Langaas Foreleses mandag 11.oktober,

Detaljer

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden.

Siden vi her har brukt første momentet i fordelingen (EX = EX 1 ) til å konstruere estimatoren kalles denne metoden for momentmetoden. Estimeringsmetoder Momentmetoden La X, X 2,..., X n være uavhengige variable som er rektangulært fordelte på intervallet [0, θ]. Vi vet da at forventningsverdiene til hver observasjon og forventningen

Detaljer