Framflyt Modellverktøy for flytteprognosar
Disposisjon Del 1: Generelt om Framflyt bakgrunn, logikk, oversyn Del 2: Rettleiing i bruk av Framflyt
Problem i fjor Ved målstyring etter nettoflytting kan PANDA berre rekne ut «nivåfaktorar». Dette er historiske gjennomsnitt, og ingen berekning av trend. Framtidig nettoflytting vil dermed bli sett likt gjennomsnittet for valt historisk periode («estimeringsperiode for nivåfaktorar»).
Løysing i fjor Ein kan leggje inn eigne tal for flytting i PANDA. I fylkesprognoser i fjor la dei fleste fylka inn tal frå SSB sin 4M-prognose, mens Rogaland la inn sine eigne tal og Hordaland og Nordland berekna framtidig flytting basert på historisk utvikling. Hordaland og Nordland sine tal var basert på simpel bivariat regresjon, der nettoflytting blei berekna som ein funksjon av (den naturlege logaritmen av) tid.
Problem i år For dei fylka som i fjor nytta 4M: SSB har ikkje produsert folketalsframskriving i år. For dei fylka som i fjor nytta bivariat regresjon: Ein modell som berre ser flytting som ein funksjon av tid har veldig høg uforklart varians.
(Mogleg) løysing i år I Framflyt har vi i år eit modellverktøy der kvart fylke kan gjere eigne bivariate eller multivariate regresjonar. Flytting kan no bli berekna som ein funksjon av (kombinasjonar av) tid, arbeidsløyse og bustadbygging. Med Framflyt kan ein òg berekne fleire typar flytting.
NB! Framflyt kan berre framskrive trend på flyttinga til nye nivå. Modellen kan ikkje nyttast til å berekne reversering av flyttemønsteret tilbake til tidlegare nivå (spegelvending) slik t.d. Rogaland la inn som føresetnad i Fylkesprognoser i fjor. Slik spegelvending er derimot enkelt å berekne utan avanserte modellverktøy. Berre ver obs på at Framflyt ikkje kan tenkje for deg! Du må sjølv velje kva føresetnader du vil leggje til grunn i ditt prognosearbeid!
Framflyt 2014-2030 (beta) Framflyt er bygd opp i Excel (xlsx: minimum 2007 er påkrevd). Det er lagt inn data om innflytting, utflytting, nettoflytting, innvandring, utvandring, nettoinnvandring, arbeidsløyse og bustadbygging for alle landets 428 kommunar. For kvar kommune er det mogleg å hente ut 111 regresjonar for kvar flyttetype. I alt ligg det 285 048 regresjonar i Framflyt. I tillegg kjem eit (u)tal moglegheiter til å framskrive dataa i føresetnadene.
Modellgrunnlag 1) Regresjonsanalyse basert på eit (relativt strengt) sett føresetnader. 2) Framskriving av føresetnadene. 3) Multiplisering av effektane frå regresjonsanalysen med dei framskrivne føresetnadene.
1) Regresjonsanalyse Enkelt forklart brukar vi regresjonsanalyse til å svare på spørsmål om kor stor flytting vi kan vente oss i framtida med den informasjonen vi i dag har om historisk endring i flytting over tid, og om historiske tal på arbeidsløyse og bustadbygging. Effektane blir isolert frå kvarandre, slik at ein kan si kva effekt t.d. arbeidsløyse har på flytting dersom vi held dei andre variablane konstant.
1) Regresjonsanalyse Logikken i regresjonsanalyse, utan å gå for mykje inn på teknikken: Kvar observasjon av flyttedata for kommune k på tidspunkt t kan bli sett opp i ei matrise av likningar med fleire ukjende: Flytting Oslo2005 = b Oslo2005 *arbeidsløyse Oslo2005 + c Oslo2005 *bustadbygging Oslo2004 + d Oslo2005 *log(1) + restverdi Oslo2005 Flytting Oslo2006 = b Oslo2006 *arbeidsløyse Oslo2006 + c Oslo2006 *bustadbygging Oslo2005 + d Oslo2006 *log(2) + restverdi Oslo2005 Flytting Oslo2013 = b Oslo2013 *arbeidsløyse Oslo2013 + c Oslo2013 *bustadbygging Oslo2012 + d Oslo2013 *log(9) + restverdi Oslo2005
1) Regresjonsanalyse Denne matrisa kan bli redusert til: Flytting kt = a kt + b kt *arbeidsløyse kt + c kt *bustadbygging kt + d kt *log(tid) t + e kt Her er det kome til eit konstantledd, a k, som er den gjennomsnittlege verdien på flytting når arbeidsløyse, bustadbygging, tid og andre variablar (rest) er lik null. Restverdien forkortast til e kt
1) Regresjonsanalyse Matrisa kan vidare bli generalisert for alle tidspunkt ved hjelp av regresjonsanalyse, der formålet er: 1) å finne ein generell effekt for kvar variabel 2) som er kontrollert for dei andre variablane, og 3) som har det minste samla avviket frå dei observerte dataa: Flytting k = a k + b k *arbeidsløyse k + c k *bustadbygging k + d k *log(tid) + e k t-ane er her fjerna Restverdien forkortast til e k, som er summen av avvik for kommune k på alle tidspunkt t, og skal altså vere minst mogleg e k inneheld all anna variasjon i flytting som ikkje er fanga opp av tid, arbeidsløyse og bustadbygging
1) Regresjonsanalyse Viss vi ignorerer den uforklarte variasjonen i e, får vi det generelle uttrykket: Flytting k = a k + b k *arbeidsløyse k + c k *bustadbygging k + d k *log(tid)
1) Regresjonsanalyse I Framflyt kan du velje om vil ha ein, to eller tre uavhengige variablar. Du kan i tillegg velje om tid skal målast lineært eller loglineært. Lineært mål på tid er ikkje anbefalt, men er teken med så ein kan samanlikne med loglineære modellar og lettare forstå forskjellen, og i tilfelle ein vil gjere eigne (andre) transformasjonar av dataa. Det gir derimot liten meining å forvente noko anna enn lineær samanheng mellom bustadbygging og flytting, og mellom arbeidsløyse og flytting, så for å avgrense valmoglegheitene (og kodinga av Framflyt) får du berre målt lineær effekt av bustadbygging og arbeidsløyse. Vil du sjølv utføre logtransformasjon (eller anna transformasjon) av variablane kan du gjere dette ved å bytte ut grunnlagsdataa, men dette er for vidarekomne!
3) Multiplisering Vi får vår prognose for framtidig flytting ved å multiplisere det generelle uttrykket frå regresjonsanalysen med dei forventningane vi har til framtidig arbeidsløyse og bustadbygging. Flytting k = a k + b k *arbeidsløyse k + c k *bustadbygging k + d k *log(tid)
0 5000 Føresetnadene Kvifor er arbeidsløyse relevant? 10000 15000 Endring i nettoinnvandring mellom to kvartal, 1999K1-2013K2-5000 0 5000 1,5 2 2,5 3 3,5 4 4,5 Prosent heilt arbeidslause i Noreg, første månad i kvartalet, 1999K1-2013K2-1 -,5 0,5 1 Endring i % helt arbeidsledige mellom to kvartal (første mnd i kvartalet), 1999K1-2013K2 Datagrunnlag: SSB
Nettoinnvandring til Noreg, 2001-2012 Årleg endring i nettoinnvandringa til Noreg, 2000-2012 50 000 Føresetnadene Kvifor er bustadbygging relevant? 40 000 20 000 30 000 15 000 20 000 10 000 10 000 5 000 0 0 17 000 19 000 21 000 23 000 25 000 27 000 29 000 31 000 Fullførte bustader i Noreg året før innvandringa -5 000-10 000-8 000-6 000-4 000-2 000 0 2 000 4 000 6 000 8 000 Endring i tal fullføte bustader året før innvandringa
2) Framskriving av føresetnadene Kva forventningar kan vi ha til framtidig arbeidsløyse og bustadbygging? I Framflyt får du fire val for kvar variabel: 1) Framtidige data følgjer som ei rett (lineær) line frå dei historiske dataa (ikkje anbefalt å bruke). 2) Framtidige data følgjer ei loglineær line frå dei historiske dataa. 3) Framtidige data svarer til eit gjennomsnitt av dei historiske dataa. 4) Du kan sjølv leggje inn eigne verdiar for framtida (om du til dømes har eigne forventningar til framtidig bustadbygging, eller du vil lage ulike scenario).
2) Framskriving av føresetnadene Når du har valt kva form framtidige data for arbeidsløyse og bustadbygging skal følgje, må du velje kva historikk du vil leggje til grunn. Du kan strekkje historia tilbake til 2000, men du kan ikkje stoppe historia før 2013! T.d. er det mogleg å velje 2005-2013, men det er ikkje mogleg å velje 2005-2012.
3) Multiplisering Når du no har valt deg eit framtidsbilete av dei uavhengige variablane, vil Framflyt multiplisere dette med resultatet frå regresjonsanalysen, og du får levert ein ferdig prognose for framtidig flytting.
Var dette vanskeleg? Første gang du opnar Framflyt, står modellen likt med den modellkjøring som Hordaland og Nordland gjorde i Fylkesprognoser 2012. Alt du treng å gjere er å leggje inn eigne berekningar av flyttetal og arbeidsløyseprosent for 2013. Dermed får du straks ein oppdatert modell av modellen til Hordaland og Nordland i fjor som var nettoflytting som funksjon av den naturlege logaritmen av tid. Alle (begrunna) val du gjer ut over dette hever kvaliteten i ditt prognosearbeid!
Slutt på del 1
Eigne berekningar av arbeidsløyse og flytting i 2013 Hordaland og Nordland si løysing på dette i fjor var som følgjer: Nettoflyttinga i 2012 var estimert basert på registerdata per tredje kvartal 2012 og gjennomsnittleg differanse mellom tredje og fjerde kvartal siste fem år. SSB publiserer flyttetal og tal arbeidslause for 2013K3 21. november. Arbeidet med Fylkesprognoser 2014 kan derfor startes for fullt 21.11. kl. 10:00!
Spesielle tilfelle: ekstremverdiar Viss du har ekstremverdiar i byrjinga av ein serie, utelet du berre dei første åra. Det kan i nokre tilfelle vere behov for å utelate ekstremverdiar midt inne i eller på slutten av ein serie. Det er ikkje mogleg å utelate dei heilt, men det er mogleg å korrigere dei. Dette må i så fall gjerast manuelt: Du bytter da data i grunnlagsdataa og oppdaterer pivottabellen i Framflyt sjølv. Den anbefalte korreksjonen av ekstremverdiar midt inne i ein serie er å bytte dei ut med gjennomsnittet av verdiane for åra før og etter. Ved ekstremverdiar på slutten av ein serie, må du bruke skjønn, og finne fram til ein justert verdi sjølv.
Spesielle tilfelle: andre uavhengige variablar Det kan hende du ikkje er nøgd med å bruke dei forhandsinnlasta variablane, men heller vil nytte nokre andre. Til dømes kan det hende du vil nytte endring i arbeidsløyse i staden for nivå, eller at du vil bytte bustadbygging med ein heilt annan variabel. Det kan du gjere, men Framflyt inneheld maks tre variablar, og du må da bytte ut dei eksisterande variablane i grunnlagsdataa.
Spesielle tilfelle: andre avhengige variablar Settet med flyttedata er òg mogleg å bytte ut. Viss du har vaska dei uavhengige variablane for tidseffekt (ved å leggje inn årleg endring i staden for nivå), må du òg gjere dette for flyttedataa. Viss du vil nytte Framflyt til heilt andre data, er dette òg mogleg, men vi anbefaler da at du i staden byggjer din eigen modell! Du kan lese meir om korleis på http://office.microsoft.com/nb-no/excelhelp/rettlinje-funksjon-ha102752956.aspx
Spesielle tilfelle: anna kurvilinearitet Logaritmane som er brukt i Framflyt er såkalla naturlege logaritmar, som har grunntal 2,718. Logaritmen til talet 2,718 er soleis 1. I ein serie 1 2 3 4 5 10, vil logtala vere 0 0,69 1,10 1,39 1,61 2,30. Det kan vere ønskjeleg å nytte andre grunntal, som t.d. log10, der serien 1 10 100 1000 blir transformert til 0 1 2 3. I så fall må tala i grunnlagsdataa byttast ut, og du må passe på at alle funksjonar i Framflyt er sett til «Lineær». Dette er fordi Framflyt er bygd opp til å lese lineære data først, og om du transformerer data som i utgangspunktet er lineære, har du gjort transformasjonen i staden for Framflyt. Om du deretter set funksjonar i Framflyt til «Gjennomsnitt» eller «Loglineær», vil Framflyt produsere gjennomsnitt og logaritmar av logaritmar.
Generelt for spesielle tilfelle Ver obs på at Framflyt 2014-2030 (beta) blir publisert på Fylkesprognoser.no, og at du kan nytte dette som referanse. Pass på at du forklarar nøye kva endringar du har gjort, slik at andre som vil inn og etterprøve føresetnadene ikkje får eit heilt andre resultat!
For meir informasjon: www.hordaland.no/aud - her finn de statistikk, kart, rapportar og anna Kontakt: aud@hfk.no twitter.com/hfk_aud