Satellittdata til kartlegging av arealdekke



Like dokumenter
AR 5 BROSJYRE 1/2011 (FORSIDEN) Arealressurskart

Sør-Odal kommune. Skogkart og statistikk basert på satellittbilde, digitalt markslagskart og Landsskogtakseringens prøveflater

Skogkart og statistikk basert på satellittbilde, digitalt markslagskart og Landsskogtakseringens prøveflater

MARKSLAG- OG SKOGSTATISTIKK

NOTAT. Oppdatering av skog i FKB-AR5. 1. Innledning. 2. Skogopplysninger i FKB-AR Markslag. 2.2 Skogareal i FKB-AR5

ITC, Individual Tree Crown Technology 2006 ictrees inc.

Bølgelengde i mikrometer (pm) Fig. 8.Refleksjonskurver for vann, frisk vegetasjon og bar jord som funksjon av bølgelengde.

Beitekartlegging - hvordan gjør vi det i dag?

MARKSLAG OG SKOGSTATISTIKK

Ressursoversikt fra Skog og landskap 04/2007 MARKSLAGSTATISTIKK. Norges nasjonalparker. Geir-Harald Strand

Skogkart og statistikk basert på satellittbilde, digitalt markslagskart og Landsskogtakseringens prøveflater

Fjernmålingsdata: Hva kan vi «se» i skogen?

Ny oversikt over skogressursene i Norge Basert på data fra satellitt og nasjonal detaljert høydemodell.

4 Metode. 4.1 Satellittbildekart

SOSI standard - versjon Databeskrivelse: Markslag

Beregning av areal som kan bli tresatt ved temperaturheving

Som en oppfølging av dette arbeidet ønsker DN å se på mulighetene for å bruke satellittdata for å identifisere naturtypene som skal kartlegges.

5 Resultater - diskusjon

Metodikk for å beregne maksimal lengde buffersoner i Øyeren

Skogressurser og karbonkretsløp

EKSAMEN I EMNE SIB 6005 GEOMATIKK-1. Torsdag 25. november 1999 Tid:

Satellittbilder til kartlegging av arealdekke

Tilstand og utvikling i norsk skog for noen utvalgte miljøegenskaper. Aksel Granhus, Skog og Tre,

AR5 STATUS, SENTRAL LAGRING, AJOURHOLD OG BRUKSOMRÅDER

PLANLEGGING OG OPPFØLGING AV VEGETASJONSKONTROLL

Alder og utviklingstrinn

Kartlegging av utvalgte nye organiske miljøgifter M. NB Rana Deootblblloteket

Bildematching vs laser i skogbruksplantakst. Hurdalsjøen Hotell, 16. november 2016 Terje Gobakken og Stefano Puliti

Markslagsstatistikk. Retningslinjer for produksjon av faktaark for kommunene. Overflated yrka mark Innmarksbei te. (Areal i dekar) Fulldyrka mark

Markslagstatistikk. 01 Østfold

Satellittbilder til kartlegging av arealdekke endringer - en utprøving av metodikk for utvalgte inngrepstyper

Elgbeitetakst 2011 Gol

Bruk av satellittdata i landbruket?

Veileder i kartlegging etter Natur i Norge (NiN)

Tilvekst og skogavvirkning

Den spektrale skogen og byen

Elgens beitegrunnlag i Norge:

Fagartikkel. Miljøregistreringer i Landsskogtakseringen og skogbruksplanleggingen. Forskjellige kartleggingsmetoder utfyller hverandre

Kartlegging av granbarkborre skader i skog

Kurs i automatisk skog kartlegging 5-7 september 2018

HVORDAN LESE KVARTÆRGEOLOGISKE KART. Astrid Lyså og Ola Fredin. Foto: A. Lyså

Arealressurskart i liten målestokk

SAMMENDRAG. AR5, kartografi, symboler AR5, cartography, symbols. Andre aktuelle publikasjoner fra prosjekt:

Overvåking av norske breers utbredelse og endring fra satellitt.

Rundskriv om skogbruksplanlegging med miljøregistrering. Vedlegg 4. Kravspesifikasjon

Bruk av satellittbilder og GIS til kartlegging av norske breer

Nøyaktighet og innhold i de norske CORINE Land Cover 2006 klassene

Kontroll av DTM100 i Selbu

Deteksjon av gravminner fra høyoppløselige satellittbilder. Deteksjon av fangstgroper. Øivind Due Trier og Arnt-Børre Salberg

Sysselsetting, kompetanse og fritid

KONSEKVENSVURDERING TILLEGGSOMRÅDER KOMMUNEDELPLAN TOKE OG OSEID K O N S E K V E N S V U R D E R I N G

Forord. og 3Q for Østfold.

Hvem trenger hvilke typer NiN-data? Hvordan kan disse kartlegges?

KARTOGRAFI TIL AR5. Rapport 10/2014. fra Skog og landskap

BRUK OG AJOURHOLD AV FKB-AR5

AR 5 BROSJYRE 2/2010 (FORSIDEN) AREALRESSURSKART AR5. Valstad. Holtan. Dyrstad. Dyrstadtjønna. Skardaunet

Felles utnyttelse av datagrunnlag og teknologi. Fylkestakster - skogbruksplanlegging

Foryngelse etter hogst hva vet vi om status? Aksel Granhus Avdelingsleder - Landsskogtakseringen Norsk institutt for bioøkonomi

Trender i norsk landbruk 2010 Oslo & Akershus

Detaljert høydemodell, nyttig redskap for tilpassing til et klima i endring? Arne Bardalen Direktør, Norsk institutt for skog og landskap

Dagens kunnskap og råd om bruk av lukket hogstform

Institutt for matematiske realfag og teknologi - UMB.

Nytt sykehus i Nedre Buskerud

Evaluering av vernet. Ellen Arneberg Fagsamling Asker mai 2009

Oppfølging av handlingsplanen for rikere sump- og kildeskog 2012

Overvåking av treslag med spredt forekomst Rapport fra feltsesongen Rune Eriksen

Hvert objekt i AR5 har såkalt metadata. Metadata er informasjon om informasjonen.

Test av MSFI-metoden

Kort innføring i kart, kartreferanser og kompass

Arealstatistikk fra SSB. Kart, metoder og formidling. Margrete Steinnes Geomatikkdagene, 18 mars.

Utvalgskartlegging med laser

BESTAND, AREALBRUK OG HABITATBRUK HOS HUBRO PÅ HØG-JÆREN/DALANE, ROGALAND Kortversjon August 2013

Veileder fra Skog og landskap AJOURHOLD AV AR5. Manuskart versjon Norsk institutt for skog og landskap, Pb 115, NO-1431 Ås

Nye trender i fjernmåling

Fotogrammetrisk matching av omløpsbilder til kartlegging av skog

EKSEMPELSAMLING til VEILEDER for ADMINISTRATIVT AJOURHOLD av DIGITALT MARKSLAGSKART (DMK)

Kilden landbrukets ressursdatabase. Jostein Frydenlund

Solenergi i Bø kommune

Søknad om støtte til testprosjekt konstruksjon fra omløpsbilder Geovekst-forum

Skogbruksplanlegging med miljøregistrering

Lauvhøgda (Vestre Toten) -

Satellittdata til kartlegging av biologisk mangfold

Skogbruksplanlegging Ny organisering?

AR5 BRUKSOMRÅDER OG AJOURHOLD. Fagsamling 30. mai 2017 Ingrid M. Tenge

Mer geografisk informasjon til flere brukere på nye måter

FYLKESMANNEN I SOGN OG FJORDANE. Potensiale for auka matproduksjon i Sogn og Fjordane

Ajourhold av kartdata og jordregister

Notat Stedsangivelser er utelatt i denne internettversjonen av notatet. Kontakt Trysil kommune for detaljer.

Kartlegging av stier og løyper. Nils Flakstad - Friluftslivssamling, Værnes, 29.oktober 2013

Kartlegging av naturverdier i planlagt utbyggingsområde ved Nordagutu i Sauherad kommune

Bilder i offentlig forvaltning og prosjektering

Miljøvariabelkart mobilisering av kartlag gjennom datafangst fra ulike kilder. Lars Erikstad

Levanger kommune Landbruk RAPPORT ELG - SKOG I LEVANGER, NORD-TRØNDELAG. OVERVÅKINGSTAKST, 2003.

Overvåking av elvemusling i Strømselva, Averøy kommune Forundersøkelse

Kommunebesøk Holtålen. Bernt Audun Strømsli Kartverket Trondheim

GPS-prosjektet - bakgrunn og status høsten 2004 v/kjetil Bevanger og Olav Strand

EGEBERG I TRØGSTAD KARTLEGGING AV BIOMANGFOLD I FORBINDELSE MED NYDYRKING

Skogbruksplanlegging Mjøsen Skog BA. 1. Introduksjon 2. Takstmetodikk 3. Digitale produkter. Foto: Blom

Mer enn bare et kamera (Publisert versjon, inneholder bare FFIs egne bilder.) Bilder kommer fra mange kilder

Transkript:

Utredning 2006-5 Satellittdata til kartlegging av arealdekke Utprøving av tilgjengelige kartdata for klassifisering av Sør-Trøndelag Miljøsamarbeid Naturområder og arealbruk Dyr og planter Friluftsliv 1

Satellittdata til kartlegging av arealdekke Satellittdata til kartlegging av arealdekke Utprøving av tilgjengelige kartdata for klassifisering av Sør-Trøndelag 2 Utredning 2006-5 Utgiver: Direktoratet for naturforvaltning Dato: August 2006 Antall sider: 59 Emneord: Arealdekke, satellittdata, kartdata, dataminering, Sør-Trøndelag Keywords: Land cover, satellite data, digital map data, data-mining techniques, Sør-Trøndelag county Bestilling: Direktoratet for naturforvaltning, 7485 Trondheim Telefon: 73 58 05 00 Telefaks: 73 58 05 01 www.dirnat.no/publikasjoner TE 1199 Refereres som: Lieng, E., L. Kastdalen og J.P. Bolstad. Satellittdata til kartlegging av arealdekke. Utprøving av tilgjengelige kartdata for klassifisering av Sør-Trøndelag. DN utredning 2006-5. Copyrightangivelse for Landsat satellittbilder vist i rapporten: NASA, USGS. Forsidefoto: Utsnitt av SatNat arealdekkekart for Sør-Trøndelag og Nord-Østerdalen Ekstrakt: Dette prosjektet er en del av SatNatprogrammet, et samarbeid mellom Norsk Romsenter og Direktoratet for naturforvaltning. I produksjon av arealdekkekart for Sør-Trøndelag fylke og Nord- Østerdalen er datamineringsteknikker som beslutningstrær valgt som klassifikasjonsmetodikk etter en metode utarbeidet ved Laboratory for Global Remote Sensing Studies (University of Maryland, USA). Klassifikasjonen baserer seg på en multitemporal analyse med opptil tre satellittbilder (vår, sommer og høst). Andre datalag slik som vegetasjonsindekser og ulike rastere avledet fra terrengmodeller er brukt direkte i klassifikasjonen. Sør-Trøndelag fylke og Nord-Østerdalen var meget utfordrende å kartlegge fordi området har stor landskapsmessig variasjon og dermed liten homogenitet. Dessuten har trøndelagsområdene mye skyet vær slik at det foreligger få optimale satellittbildeopptak. Som referansedata for trening i klassifikasjonen ble en rekke eksisterende kartdatabaser hentet inn: N50 kartdata, DMK, 3Q, Landsskogtakseringen, bestandsskogtakseringer og ulike vegetasjonskart. I undersøkelsen ble det også samlet inn egne referansedata i felt og gjennom visuell tolkning av fly- og satellittbilder. Det er avdekket flere svakheter ved bruk av eksisterende kartdata som referansekilde. Graden av romlig generalisering er ofte for stor, slik at det blir vanskelig å fange opp noen trend i dataene. Vegetasjonsklassifiseringen er bygd opp rundt en plantesosiologisk legende der karakterarter er styrende for mange av klasseinndelingene. Med satellittdata er det ikke mulig å fange opp enkeltarter. Bruken av slike referansedata blir dermed lite effektiv, og gir en tematisk inndeling sterkt begrenset av at klassifikasjonen ikke er tilpasset egenskapene til optiske sensorer. Likevel, selv om eksisterende referansedata inneholder både feil og romlige generaliseringer gjør datamineringsteknikken det mulig å utnytte slike data som kilde for treningsdata til klassifikasjon av satellittbilder. Men klassene som kartlegges blir et resultat av informasjonsinnholdet i referansedataene. I dette prosjektet laget vi seks temakart, som ble satt sammen til ett arealdekkekart bestående av 32 klasser. Alle kartdata fra prosjektet kan fritt benyttes og lastes ned fra hjemmesiden til Direktoratet for naturforvaltning (www.dirnat.no/satnat). Abstract: This project is a part of the SatNat program, a joint effort between the Norwegian Space Centre and the Norwegian Directorate for nature management. Data mining techniques such as decision and regression trees have been utilized in order to produce land cover maps of Sør-Trøndelag county and Nord- Østerdalen from a methodology established by Laboratory for Global Remote Sensing Studies (University of Maryland, USA). The classification is based on multitemporal analysis of up to three satellite images. Ancillary data such as vegetation indices, DEM derived raster layers and more is applied directly to the classification. Sør-Trøndelag County is extremely challenging to map due to a very diverse landscape and low homogeneity. A short growing season and frequent cloud coverage leaves few optimal satellite images available. Numerous map data bases were used as training for the classification. Topological maps, land inventory maps, forest stand maps, national forest inventory samples and vegetation maps. Reference data based on field observations and visual image interpretation of aerial and satellite images was collected in the project as well. Existing map data are not optimal as a source of reference data. It has proven difficult to extract information about the sought classes since the degree of spatial generalisation is mainly too big. Vegetation maps are based on a plant sociological legend were character species decides the class hierarchy. Satellite data can not identify single species. The use of this kind of reference data is therefore inefficient and the resulting map legend will be strongly restrained since the classification is not adapted to optical sensors. However, the the use of data mining techniques shows that we can use reference data as a source for classification of satellite data although it contains both errors and spatial generalisation. The mapped classes will be a result of the information in the reference data. In this project we made six thematic maps which we combined to a land cover map containing 32 classes. All map data from the project may freely be used and downloaded from the web-site of Norwegian Directorate for Nature Management (www.dirnat.no/satnat).

Forord Norsk Romsenter (NRS) og Direktoratet for naturforvaltning (DN) etablerte i 2001 et 5-årig program (SatNat) for å utvikle produkter og produksjonsgang for bruk av satellittdata innen naturforvaltningen. Programmet er inndelt i flere prosjekt, hvorav et prosjekt omhandler metodeutvikling for å lage fylkesvise arealdekkekart. Til dette formålet ble Sør-Trøndelag og Østfold fylker valgt som prøveområder. Denne rapporten beskriver analysene foretatt i Sør-Trøndelag og deler av Nord-Østerdalen. Arealdekkekartleggingen av Østfold er rapportert i DN-utredning 2004-3. Arbeidet er gjennomført av Einar Lieng (Høgskolen i Hedmark), Leif Kastdalen (Norsk Romsenter/ Høgskolen i Hedmark) og Jan-Paul Bolstad (Direktoratet for naturforvaltning). Til analysene er det benyttet data fra ulike institusjoner. Satellittbilder (IRS-1C, SPOT og Landsat ETM+) og N50 kartdata er levert av Statens Kartverk og Geodatasenteret AS. Bestandsskogsdata for ulike kommuner i Sør-Trøndelag er velvillig stilt til disposisjon fra Skogeierforeningen Nord, mens NIJOS har bidratt med data fra Landsskogtakseringen og 3Q for Sør-Trøndelag. NTNU Vitenskapsmuseet har deltatt i innsamling av referansedata og delvis benyttet egne data som kilde til klasseinndelingen. I samarbeid med Høgskolen i Telemark har NTNU Vitenskapsmuseet utformet et system for kategorisering av vegetasjonselementer i felt eller ved tolking av høyoppløselige bildedata. Matthew C. Hansen (nå Geographic Information Science Center of Excellence, South Dakota State University; tidligere tilknytning Laboratory for Global Remote Sensing Studies, University of Maryland) har gitt opplæring i hvordan datamineringsteknikker kan benyttes i analyse av satellittdata, og tilbrakt en måned i Norge for å bistå med selve analysene. Vi takker alle som har bidratt i dette prosjektet. Trondheim, juni 2006 Yngve Svarte (sign.) Direktør Artsforvaltningsavdelingen 3

Satellittdata til kartlegging av arealdekke Satellittdata til kartlegging av arealdekke Innhold 1 Innledning... 6 2 Målsetting... 7 3 Studieområde... 8 4 Metodikk... 9 4.1 Tolkning og analyse av optiske satellittbilder...9 4.1.1 Hva optiske satellittsensorer måler...9 4.1.2 Spektrale klasser kontra informasjonsklasser...9 4.1.3 Hovedtyper av klassifikasjonsmetoder...10 4.1.4 Klassifikasjon med beslutningstre og regresjonstre...10 4.1.5 Bakgrunn for valg av analysemetodikk...11 4.1.6 Multi-Resolution Land Characteristics (MRLC)...11 4.1.7 MODIS Global Land Cover dataset...11 4.2 Inndeling i arealklasser...11 4.3 Validering av klassifikasjonen...12 5 Datagrunnlag... 15 5.1 Referansedata...15 5.1.1 Data for skogareal...15 5.1.2 Data for skog, åpen mark og dyrket mark...17 5.1.3 Data for fjellområder...18 5.1.4 Andre tilgjengelige kartdata...18 5.1.5 Høyoppløselig bildemateriale...19 5.1.6 Punktbasert skjermdigitalisering...20 5.2 Satellittbilder og avledede vegetasjonsindekser...20 5.2.1 Valg av satellittbilder...20 5.2.2 Geometrisk korreksjon og referansesystem for bilder...21 5.2.3 Normalisert vegetasjonsindeks (NDVI)...22 5.2.4 Andre indekser...23 5.3 Basiskart...23 5.3.1 N50 arealtema...23 5.3.2 N50 terrengmodell og avledede rasterlag...23 5.3.3 Vegetasjonssoner...23 6 Produksjonsprosessen... 24 6.1 Etablering av skyfrie multitemporale datasett...24 6.2 Inndeling i regioner...24 6.3 Uttrekk av referansedata...26 6.4 Beslutningstre analyser...26 6.5 Sammensetting av klassifiserte raster...28 4

7 Resultat... 29 7.1 SatNat kartene...29 7.2 Samsvar mellom eksisterende kartdata...29 7.3 Lokaliseringsavvik mellom piksel og referansepunkt...30 7.4 Skala i referansedata...31 7.5 Temakart for skogareal...32 7.5.1 Tretetthet...32 7.5.1 Treslag...32 7.5.1 Skogtilstand...33 7.5.2 Skogtypekart...34 7.6 Temakart for fjell og åpne områder i lavlandet...35 7.6.1 Inndeling i fjell og lavland...35 7.6.2. Klassifikasjon av åpen mark...35 7.7 Temakart for myr og jordbruksmark...37 7.7.1 Myr...37 7.7.2 Jordbruksmark...37 7.8 Arealdekkekart Sør-Trøndelag og Nord-Østerdalen...38 8 Diskusjon... 41 8.1 Valg av klasser...41 8.2 Klassifikasjonsmetoden...41 8.3 Satellittdata...42 8.4 Treningsdata...42 8.4.1 Treningsdata og beslutningstreanalyser...42 8.4.2 Egnethetsvurdering av eksisterende kartdata...43 8.5 Tematisk nøyaktighet...46 8.6 Mulige forbedringer i analysemetoden...48 8.7 Vegen videre til et operasjonelt system...49 9 Konklusjoner og anbefalinger... 50 10 Referanser... 51 11 Vedlegg... 54 11.1 Validering av klassifikasjon (feilmatriser)...54 11.1.1 SatNat Treslag...54 11.1.2 SatNat Skogtilstand...55 11.1.3 SatNat Åpen mark...57 5

Satellittdata til kartlegging av arealdekke 1 Innledning Norsk Romsenter og Direktoratet for naturforvaltning etablerte i fellesskap programmet (SatNat) i 2001. Hensikten med SatNat-programmet var å utvikle metoder der satellittdata var et hjelpemiddel i bruk og forvaltning av naturressurser. To prosjekt i dette programmet har vært rettet mot utprøving og utvikling av metoder for arealdekkekartlegging av store areal. Det er tidligere utført arbeid i Norge med heldekkende kartlegging av store areal, både ved visuell tolking (Hjeltnes m.fl. 1996) og med ikke-styrt klassifikasjon (Johansen m.fl. 1995). I Sverige er det nylig gjennomført en metodeutvikling og produksjon av et arealdekkekart for hele landet (Lantmäteriet 2003), som et ledd i EUs etableringen av CORINE Land Cover for alle medlemsland. Metodikk for CORINE kartlegging er også prøvd ut i Norge (Arnoldussen m.fl. 1999). Arbeidet som er gjennomført i SatNat må sees på som komplimenterende til disse arbeider, da det her er valgt å prøve en styrt klassifikasjon basert på datamineringsteknikker og på bruk av eksisterende datakilder for trening av klassifikasjonen. Dette er en relativt ny tilnærming i analyser av bildedata. Ved oppstart av dette prosjektet var det ingen vedtak i Norge om etablering av CORINE Land Cover. I 2004 fikk NIJOS i oppgave å lage et slikt kart basert på den topografiske kartserien N50 og det digitale markslagskartet (DMK) som hovedkilde, supplert med tolking av satellittdata i fjellområdene. Arbeidet med metodeutprøvingen i SatNat har fokusert på å utvikle en robust og automatisert metode for heldekkende arealkartlegging med satellittdata, og hvor kartdataene også var egnet til produksjon av utbredelseskart for viltarter ved hjelp av habitatmodeller. Utviklingsarbeidet har foregått i Østfold og Sør-Trøndelag, og denne rapporten dokumenterer arbeidet i Sør- Trøndelag. 6

2 Målsetting Prosjektets hovedmålsetting: Utvikle en kostnadseffektiv og objektiv metodikk til produksjon av arealdekkekart for store arealer (fylker) basert på analyser av satellittbilder. Prosjektets delmål: Utprøve og validere egnethet av å bruke eksisterende kartdata som referanse (data til trening og validering) til klassifikasjon av data fra Landsat-satellittene. Et mål er at slike kart kan gi grunnlag for arealmessige vurderinger for områder på størrelse med kommuner og fylker. Med kostnadseffektiv metodikk menes det at metodikken skal kunne implementeres i automatiserte rutiner, slik at det minimaliserer manuelt arbeid og graden av subjektiv tolking. Videre vil gjenbruk av eksisterende landsdekkende databaser kunne representere en tidsbesparelse sammenlignet med at feltregistreringer blir innhentet i hvert kartleggingsprosjekt. Utarbeide arealdekkekart med tematisk inndeling relevant for bruk til modellering av potensielle vilthabitat. 7

Satellittdata til kartlegging av arealdekke 3 Studieområde For utprøving av metodene beskrevet i denne rapporten ble Sør-Trøndelag fylke og den øvre delen av Nord-Østerdalen (deler av Tynset, Tolga og Os) valgt som testområde. Dette utgjør et landareal på 22 100 km 2, hovedsakelig bestående av fjell og skog. Arealet er langt større enn det areal som tidligere har blitt kartlagt (Østfold, 4 200 km²) etter tilsvarende metoder (Vikhamar m. fl. 2004). Arealet ble valgt såpass stort for å belyse problematikken som oppstår når det må brukes flere satellittbilder for å dekke et kartleggingsområde og for å fange opp et stort spekter av landskapstyper. For å dekke hele Sør-Trøndelag og Nord- Østerdalen var det nødvendig å bruke mange satellittscener. Kartleggingsområdet er også landskapsmessig meget variert (tabell 3.1). Det strekker seg fra kystområdene i vest til høyfjellområder på over 2200 meter og innehar vegetasjonssoner fra boreonemoral til høgalpint (Moen 1998). Klimaet varierer fra sterkt oseanisk til svakt kontinentalt. Tabell 3.1. Arealfordeling i studieområdet Sør-Trøndelag og deler av Nord-Østerdalen. Med fjell, åpent menes areal som ikke er gitt noe arealtema i N50. Skogarealet i N50 er betraktelig høyere enn produktivt skogareal (SSB 2003). Med annet areal menes bebyggelse, steintipp, parker med mer. N50 Arealtype Antall km 2 Fordeling Fjell, åpent 9 076 41,1 % Skog 8 505 38,5 % Myr 2 498 11,3 % Vatn, elv 1 091 4,9 % Dyrka mark 865 3,9 % Annet areal 73 0,3 % Sum 22 108 100,0 % Figur 3.1. Mosaikk av bilder fra Landsat og IRS satellittene over studieområdet (Sør- Trøndelag og deler av Nord-Østerdalen). 8

4 Metodikk 4.1 Tolkning og analyse av optiske satellittbilder 4.1.1 Hva optiske satellittsensorer måler Et optisk satellittbilde er et digitalt bilde som består av piksler eller bildeelementer. Pikselen inneholder en verdi (vanligvis mellom 0 og 255) som representerer reflektert sollys målt av satellittsensoren. Pikselverdien kan omregnes til radians eller reflektans ved hjelp av kalibreringsverdier oppgitt for den enkelte sensor. Med radians menes energien i de elektromagnetiske signaler som satellitten måler og med reflektans menes forholdet mellom innstrålt og avgitt lys fra en overflate. Hovedbidraget til den målte radiansen er reflektert sollys innenfor et areal på bakken som tilsvarer sensorens romlige oppløsning. Ulike overflatetyper har ulike reflektansegenskaper. Dette illustreres i figur 4.1 ved hjelp av spektrale signaturer til jord, vegetasjon og vann. I tillegg til at ulike overflatetyper reflekterer sollyset forskjellig påvirker også atmosfæren og topografien lysrefleksjonen. Ulike gasser og partikler i atmosfæren reflekterer og absorberer sollys. Dette er effekter som varierer over tid, og som en ideelt sett bør korrigere for. Videre har geometrien mellom solens posisjon, sensorens posisjon og terrengets helning og helningsretningen sterk innflytelse på målt lysrefleksjon. En søker dermed en metodikk for å identifisere spektrale klasser som representerer ønskede informasjonsklasser. Flere spektrale klasser utgjør ofte en enkelt informasjonsklasse. Et eksempel er et tilfelle der en skal kartlegge ulike skogtyper og man ønsker informasjonsklassene barskog og løvskog. Løvskog kan finnes i satellittbildet som de spektrale klassene: skyggelagt tett løvskog, belyst tett løvskog, skyggelagt glissen løvskog, belyst glissen løvskog. Klassifikasjon av satellittdata består i å kategorisere og tilordne en informasjonsklasse til hver piksel i et satellittbilde. Resultatet blir et temakart. Grunnlaget er den spektrale signaturen til hver enkelt overflate. To overflater skilles best fra hverandre ved å benytte de bølgelengder hvor overflatene har størst forskjell i spektral signatur. Klassifikasjon av en piksel som gjøres utelukkende ved hjelp av denne ene pikselens spektrale informasjon kalles pikselvis klassifikasjon. En klassifikasjon kan bli bedre dersom det inkluderes informasjon fra pikselens naboskap. Med naboskap menes piksler som ligger ved siden av eller i nærheten av pikselen som skal klassifiseres. Dette refereres til som tekstur. Klassifikasjonen kalles da gjerne kontekstuell klassifikasjon. Det er også mulig å beregne andelen av en type innenfor en piksel. Dette refereres til som subpiksel klassifikasjon. 4.1.2 Spektrale klasser kontra informasjonsklasser Når målsetningen med en analyse av satellittbilder er å lage et temakart er det viktig å først definere hvilke klasser som ønskes vist på kartet. Slike klasser kalles informasjonsklasser. Utfordringen med å lage et temakart som resulterer i ønskede informasjonsklasser er at de ofte ikke tilsvarer de spektrale klassene som finnes i et satellittbilde. Spektrale klasser er naturlige grupperinger av refleksjonsverdiene i satellittdataene. Figur 4.1. Spektrale signaturer til jord, vegetasjon og vann i et spekter fra blått (0,4 μm) til midlere infrarødt lys (2,6 μm). 9

Satellittdata til kartlegging av arealdekke Ja 4.1.3 Hovedtyper av klassifikasjonsmetoder Ja Nei Ja Nei Ja Nei Ja Nei Nei Figur 4.2. En enkel illustrasjon som viser hvordan et beslutningstre deler opp datasett i mindre enheter ved hjelp av regler. Ved beslutningsregler kan kompliserte datasett skilles fra hverandre. Merk også at i et beslutningstre må reglene utføres i en bestemt rekkefølge. Vanligvis blir klassifikasjonsmetoder skilt i hovedgruppene styrt og ikke-styrt klassifikasjon (Campbell 1996, Hastie m. fl. 2001). Ved styrt klassifikasjon behøves a priori kunnskap om hvilke klasser som ønskes kartlagt. Treningsdata er da viktig for å trene opp klassifikatoren. Til dette behøves informasjon om områder i bildet hvor det er sikkert at disse klassene finnes. Denne informasjonen brukes så til å styre inndelingen i klasser gjennom bruk av ulike algoritmer. Algoritmene vil da forsøke å finne optimale sammenhenger mellom responsvariabelen (informasjonsklassene) og de uavhengige variabler som legges inn i analysene (Tan m. fl. 2006). Dette kan være båndene fra satellittdataene eller data fra andre kartkilder. Ikke-styrt klassifikasjon er en motsatt tilnærming. Satellittbildet inndeles statistisk i naturlige spektrale klasser. Etter klassifikasjonen identifiserer man hvilken informasjonsklasse hver enkelt spektral klasse tilhører. Statistiske separabilitetsmål brukes som støtte i dette arbeidet. De vanligst brukte klassifikasjonsalgoritmene for begge disse hovedtilnærmingene (styrt og ikke-styrt klassifikasjon) er basert på parametriske modeller for å beregne klassesignaturene, men optiske data følger ikke alltid slike statistiske fordelinger. Bruken av styrt og ikke-styrt klassifikasjon har endret seg mye siden teknologien kom i 1970-årene. I starten ble styrt klassifikasjon brukt mye. På 90-tallet ble ikke-styrt klassifikasjon nesten enerådende. Med økt tilgang til høyoppløselige digitale bilder fra fly og satellitt, forbedret diskplass og nye analysemetoder har styrt klassifikasjon igjen fått økt fokus. Et alternativ til en maskinmessig klassifikasjon er visuell tolkning ved digitalisering på skjerm eller papirkart. Denne metoden brukes ofte i grovere målestokker. Løsningen gir kart som er visuelt innbydende, men den er arbeidskrevende. For kartlegging av store områder blir den romlige detaljeringen begrenset, dersom arbeidsmengden skal holdes på et akseptabelt nivå. NIJOS lager nasjonale arealressurskart i målestokk 1: 250 000 (AR250, Moum 1999) på denne måten. 4.1.4 Klassifikasjon med beslutningstre og regresjonstre For å lage arealdekkekart i Sør-Trøndelag har vi valgt styrt klassifikasjon med beslutningstrær som metodikk. Beslutningstrær til bruk i klassifisering av arealdekke ble valgt til analysene fordi det i lignende arbeider har vist seg å være en lovende metode (Homer m. fl. 2002, Hansen m.fl. 2000). Beslutningstrær og regresjonstrær tilhører en type analysemetoder som kalles dataminering (Campbell 1996, Hand m. fl. 2001, Witten & Frank 2005), og er basert på en logisk oppsplitting i ønskede klasser. Oppsplittingen skjer ut fra et prinsipp at splittingen øker forklaringsgraden, og det brukes logiske regler for hver gruppesplitt (figur 4.2). Resultatet blir en trestruktur, der greinene (kalt noder) representerer en klasse. Når greiner ender uten nye forgreninger gir økt splitting ingen forbedret forklaring. Ved å etablere regler fra et utvalg med treningsdata, kan reglene etterpå benyttes effektivt på store datamengder. Metoden er derfor egnet for analyser av satellittdata som dekker store områder. Beslutningstreet tildeler en klasse til hvert eneste piksel i det kartet som lages. Forskjellen på beslutningstre og regresjonstre er at den første 10

Metodikk gir distinkte klasser som resultat, mens den andre gir som resultat en kontinuerlig variabel. Regresjonstre brukes derfor mye til å beregne hvor stor andel av en piksel som utgjøres av en spesiell type, for eksempel hvor stor andel (0-100 %) av en piksel som dekkes av lav. En sammenligning av ulike metoder for kartlegging av arealdekke med satellittbilder er beskrevet i f.eks. Pal & Mather (2003) og Hansen m.fl. (1996). Artiklene fokuserer spesielt på beslutningstreanalyser. 4.1.5 Bakgrunn for valg av analysemetodikk Avsnittet presenterer to eksempler på arealdekkekartlegging som har vært sentrale i valg av metodikk ved utarbeidelse av kartet over Sør- Trøndelag. I forberedelsene til dette prosjektet ble det tatt kontakt med personer sentrale i Gap Analysis Program i USA (www.gap.uidaho. edu) og to arbeidsseminar ble holdt med personer fra GAP-miljøet. Senere ble det også tatt kontakt med Laboratory for Global Remote Sensing Studies ved University of Maryland (USA). Disse miljøene arbeidet spesielt med vegetasjonskartlegging av større areal basert på satellittdata. 4.1.6 Multi-Resolution Land Characteristics (MRLC) I USA er to heldekkende kartlegginger av arealdekke satt i gang først og fremst basert på data fra Landsat-satellittene. Den første generasjons kartlegging i 1992 baserte seg på klustring (ikke-styrt klassifikasjon). Her ble det brukt data fra Landsat5-satellitten og hver delstat ble kartlagt hver for seg. Et klassifikasjonsskjema med 21 klasser var grunnlaget for kartleggingen. Samlet kom kartet ut med en nøyaktighet per piksel på 45 %. Denne tilnærmingen er beskrevet nærmere på webadressen: http://landcover.usgs.gov/natllandcover.asp. I andre generasjons kartlegging fra 2001 (noe arbeid gjenstår fortsatt i 2005) er beslutnings- og regresjonstre analyser benyttet (Homer m. fl. 2002). I stedet for ett arealdekkekart over USA produseres det i denne kartleggingen en mengde datalag som kan nyttes i videre GISanalyser og presentasjoner. Referansedata fra flybilder (Huang m. fl. 2001), IKONOS satellitten, data fra landbruk og skogbruk med mer er benyttet for å lage kartene. I stedet for å kartlegge hver delstat hver for seg ble USA delt inn i 60-70 økologiske regioner (Homer & Gallant 2001). Dette gav en mer effektiv kartlegging i form av at klassene innenfor hver region er jevnere fordelt, det ble mindre spektralt overlapp mellom klassene og det gav bedre arealmessig utforming. Nøyaktigheten i klassifikasjonen ble også forbedret sammenliknet med klustringsteknikken. Denne tilnærmingen er beskrevet nærmere på webadressen: http://www.mrlc.gov/mrlc2k_nlcd.asp. Metoden ble brukt for arealdekkekartleggingen av Østfold (Vikhamar m.fl. 2004). 4.1.7 MODIS Global Land Cover dataset For Sør-Trøndelag ble samme tilnærming benyttet, men analyseprosedyren fulgte mer den metodikk som var utarbeidet ved Laboratory for Global Remote Sensing Studies (University of Maryland, USA). Denne metoden ble brukt for å lage et globalt arealdekkekart. Metoden var mer fleksibel for tilpasninger og det var enklere å undersøke reglene som ble dannet, og dermed lettere å analysere noder der to eller flere klasser hadde omtrent samme sannsynlighet for å bli valgt. Ved slike tilfeller kunne endring av noden til en annen klasse gi en forbedret resultat i kartet. Dr. Matthew C. Hansen fra Laboratory for Global Remote Sensing Studies var på besøk i Norge sommeren 2004 for å arbeide med kartet over Sør-Trøndelag. Hansens metodikk er i hovedsak lagt til grunn for denne rapporten. Metodikken er beskrevet nærmere på webadressen: http://glcf.umiacs.umd.edu/data/modis/vcf/. 4.2 Inndeling i arealklasser Det er gjort mange forsøk på å få til enighet om et felles klassifikasjonssystem i Norge. Noen systemer er laget for kartlegging i felt, andre mer for kartlegging med flybilder. Vegetasjonstyper i Norge (Fremstad 1998) er 11

Satellittdata til kartlegging av arealdekke laget for å kunne inndele vegetasjonen i typer når en er i felt. En er da avhengig av å kunne identifisere enkeltarter, noe som ikke er mulig i fly- og satellittbilder. Kartleggingen av biologisk mangfold (DN-Håndbok 13 1999) baserer seg også i stor grad på identifikasjon på bakkenivå. Landsskogtakseringen til NI- JOS er en annen kartlegging som baserer seg på observasjoner i felt. Ved kartlegging av vegetasjon over større arealer i Norge er det tradisjonelt brukt sorthvite flybilder, med inventering i felt og kartlegging i stereoinstrument. ØK/DMK og 3Q fra NIJOS og bestandstakster for skogeierforeningene er laget på denne måten. Legenden i kartene vil være en kombinasjon av egenskaper observert i felt og innmålinger utført i stereoinstrument. For kartlegging med satellittbilder er det forsøkt å lage en norsk versjon av CORINE Land Cover, en kartlegging av arealdekke basert på satellittbilder som alle EU-land må gjennomføre (Arnoldussen m.fl. 1999). I et forsøk på å enes om en norsk standard ble Nasjonalt system for arealdekkeklassifikasjon (NaSAK) utarbeidet (Gjertsen m.fl. 2003, Hjeltnes & Øien 2003 og SOSI standard for skogbestandsregistreringer, Statens Kartverk). NaSAK er et resultat fra et prosjekt på utvikling av et norsk klassifikasjonssystem for arealkartlegging og bygger igjen på det internasjonale LCCS (Land Cover Classification System) til FAO (http://dwms.fao. org/lccs/index_en.asp). I arbeidet med arealdekkekartlegging i SatNat-programmet er det blitt utarbeidet et eget system for registrering av arealtyper basert på feltkontroll eller flybildetolking (Hjeltnes & Øien 2003). Dette systemet er siden blitt noe revidert. Systemet legger større vekt på å gruppere vegetasjonsenheter slik de skilles ut ved tolking av flyfoto eller høyoppløselige satellittbilder enn grupperinger etter plantesosiologiske kriterier. Systemet bygger på NaSAK og er spesielt utformet for å være en rask metode til å kategorisere under registreringsarbeid. Vi har lagt hovedinndelingen i dette systemet til grunn for arealtypeklassifiseringen i Sør-Trøndelag, men har måttet modifisere det etter inndelinger brukt i de referansedata vi har benyttet. 4.3 Validering av klassifikasjonen Nøyaktighetsvurdering Når det blir utført en arealkartlegging må produktet valideres. En kartlegging bør ikke betraktes som ferdig før dens nøyaktighet er utredet (Lillesand & Kiefer 2000). Den vanligste metoden for å validere et kartprodukt er ved bruk av feilmatriser, dvs. en tabellarisk sammenlikning mellom klasser i et datasett mot kjente referansedata. I utgangspunktet skal valideringsdataene ikke inneholde feil og de skal være representative for det området som kartlegges. I virkeligheten vil situasjonen være annerledes. Å benytte valideringsdata uten feil er nærmest umulig å få til når det gjelder kartlegging til distinkte klasser i et landskap med kontinuerlig overganger mellom enheter. Et kartprodukt basert på styrt klassifikasjon med statistiske algoritmer kan sjelden gi større nøyaktighet i forhold til det datasett det valideres mot enn nøyaktigheten mellom valideringsdataene og treningsdataene. Tematisk unøyaktighet - feilmatrise Uansett hvor stor innsats vi legger i å få god kvalitet på valideringsdata så vil det ligge en del subjektiv tolkningsvurdering bak klasseinndelingen. Det vil for eksempel være nærmest umulig å gi en riktig anslag over dekning av ulike vegetasjonsenheter innen en 30 x 30 meters rute når en er på bakken. På samme måte vil aldri en piksel i en satellittscene treffe akkurat det arealet der refleksjonen, som har tildelt pikselen en verdi, har kommet fra. Det er alltid noe geometrisk unøyaktighet i plasseringen av bilder. Et godt resultat i en feilmatrise viser at klasseinndelingen i et kartprodukt er i samsvar med den inndeling som er brukt i valideringsdataene og at klassene kan skilles med den metoden som er brukt. De sier derimot ikke så mye om hvordan klassifikasjonen virker andre steder i kartet enn der treningsdata er hentet fra. Valideringsdata må dermed både være tilstrekkelig mange til at resultatet ikke kommer fra tilfeldigheter og de må være romlig representative 12

Metodikk slik at de fanger opp variasjonen innen de enkelte klasser. Riktigheten av valideringsdata er ofte vanskelig å avgjøre. Dersom treningsdata er av god kvalitet er det vanlig å trekke ut en tilfeldig andel til kontroll av det ferdige produktet. Siden vi for det meste har brukt data innsamlet til andre formål som grunnlag for treningen er det vanskelig å vite hvor riktige disse er både når det gjelder hva de enkelte klasser representerer og hvor tidsriktig informasjonen er sett i forhold til de satellittbilder vi har brukt. Flere av datasettene vi har hatt tilgjengelige har beskrevet den samme klassen og vært lokalisert til samme område. For å undersøke hvor god overensstemmelse vi kunne forvente mellom kartprodukt fra satellittkartlegging og kilder som var tilgjengelige som referansedata, beregnet vi feilmatriser mellom noen av disse kartkildene. I en feilmatrise benyttes begrepene produsent og brukers nøyaktighet. Begrepet produsentens nøyaktighet er mest interessant for den som lager et kart, da det sier i hvor stor grad et areal av en bestemt type ble klassifisert til den typen. Det sier derimot ikke noe om hvor mange andre arealer av andre typer som er klassifisert til den samme typen. En bruker vil ofte være mer opptatt av hvor stor sannsynlighet det er for at et gitt område (i terrenget) er blitt klassifisert til den rette typen. Brukerens nøyaktighet beskriver dette. Det er også ønskelig å beregne en nøyaktighet for alle klassene samlet. Den enkleste måten er å beregne andelen av punkter som er korrekt klassifisert og uttrykke dette i en verdi for samlet nøyaktighet. I beregninger av verdi for Kappa (Congalton&Green 1999) og Tau (Ma &Redmond 1995) er produsent og brukes nøyaktighet inkludert og disse beregninger gir samtidig mulighet for statistisk sammenlikning av kartprodukter. En Kappa analyse beregner en Khat-verdi, som vanligvis ligger mellom 0 og 1. En Kappa verdi på for eksempel 0,8 forteller at klassifikasjonen har unngått 80 % av feilene som ville ha oppstått ved en tilfeldig klassifikasjon (Congalton&Green 1999). Tau koeffisienten er noe lettere å tolke. For eksempel vil en Tau-koeffisient på 0,8 bety at 80 % av punktene var klassifisert korrekt (sammenliknet med om alt var tilfeldig klassifisert). Begge koeffisienter er tilnærmet normalfordelte og Z-statistikk kan benyttes for å undersøke forskjeller mellom kartprodukt. Vi har valgt å ta med begge koeffisienter. Kappa og Tau, sammen med verdien for samlet nøyaktighet, gir et bra bilde på hvor godt en kartlegging samsvarer med de data den valideres mot (tabell 4.1). Dersom samlet nøyaktighet i en klassifikasjon er betraktelig høyere enn Khat og Tau gir dette en indikasjon på at det er en skjev fordeling av referansepunktene mellom klassene. Klasser med få observasjoner og lav nøyaktighet blir da overdøvet av en eller flere klasser med mange observasjoner og høyere nøyaktighet. Et eksempel på dette er å finne i kapittel 7.7.2, tabell 7.15. Geometrisk unøyaktighet Satellittbildene som er benyttet i analysen har en oppløsning på 30 meter og en midlere feil på om lag 20 meter. Punktdatasettene som benyttes til validering vil også ha et lokaliseringsavvik i størrelse 5 15 meter. Dette gjør at referansepunktet kan bli plassert utenfor avgrensingen av den sammenfallende klassifiserte pikselen. For å kompensere for effekten av denne geometriske feilen har vi beregnet både en feilmatrise basert på nøyaktig lokalisering (senter av piksel) og en matrise der det er gitt treff dersom senterpunkt eller en av de åtte pikslene omkring inneholder samme klasse som valideringsdataene (Vikhamar m. fl. 2004). Senterpunkt er et mye strengere kriterium enn naboskap. Naboskap vil alltid øke treffprosenten. Tabell 4.1. Retningslinjer for tolking av Kappa og Tau verdier. Verdier Kvalitetsmål <= 0 Dårlig samsvar 0 0,2 Noe samsvar 0,2 0,4 En del samsvar 0,4 0,6 Brukbart samsvar 0,6 0,8 Stort samsvar 0,8 1,0 Meget sterk samsvar (sjeldent) 13

Satellittdata til kartlegging av arealdekke For at vi skal kunne kontrollere at denne økningen ikke er kunstig høy har vi beregnet variasjonen i pikselverdier i datasettet. Har et kart to klasser og maksimal homogenitet (ingen blanding av piksler) vil feilverdiene ved senter og naboskap være tilnærmet like. Ved maksimal variasjon i pikselverdier (sjakkbrett), vil det være maksimal forskjell på senter og naboskapsverdi. Med to klasser vil da senter teoretisk gi 50 % treff og naboskap 100 % treff ved tilfeldige data. Ved å benytte et diversitetsfilter til å telle opp antall klasser i et 3x3 område rundt referansepunktene kan dette tallfestes. En summering av diversiteten ved alle referansepunktene vil gi en indikasjon på om forbedringen i treff ved naboskapsanalyse skyldes variasjonen i pikselverdier i det klassifiserte bildet eller en antatt lokaliseringsfeil. Maksimal homogenitet i et kart vil gi en gjennomsnittlig verdi for diversitet nær 1, mens maksimal variasjon i pikselverdier gir en verdi nær antall klasser i kartet. Tabell 4.2 viser diversitet i det klassifiserte datasettet for Skogtilstand. For å undersøke nærmere effekten av naboskapskriteriet har vi beregnet hvor stor del av økningen i treffprosent som skyldes geometriske unøyaktigheter og hvor mye som skyldes variasjonen i temakartet, har vi for hvert kart gjort en senter og en naboskapsanalyse basert på tilfeldige data (se også Kap. 6.3). Økningen i treffprosent på Tabell 4.2. Diversitet i det klassifisert datasettet skogtilstand. Et 3x3 vindu rundt hvert referansepunkt i det klassifi serte bildet er undersøkt for diversitet, altså antall ulike klasser. Med fem klasser og hovedtyngden av pikslene (75 %) har en til to klasser som naboer kan nøyaktighetstallet ved naboskaps betraktning forsvares. Antall verdi 1 208 27,3 % Antall verdi 2 359 47,2 % Antall verdi 3 159 20,9 % Antall verdi 4 33 4,3 % Antall verdi 5 2 0,3 % Antall punkt: 761 Gjennomsnitt 2,03 disse tilfeldige dataene vil være et uttrykk for hvor stor virkning kartets heterogenitet har på økningen i treffprosenten ved bruk av kriteriet naboskap. Ved å trekke forbedringen som oppnås på et reelt kart der klassene er omkodet til en tilfeldig klassifisering (med samme antall klasser) fra tilsvarende økning i de reelle dataene kom vi fram til hvor stor forbedring i treffprosent som utelukkende skyldes kombinasjonen av kartets romlige struktur og antall klasser. Denne forskjellen er benyttet til å korrigere naboskapsberegningene slik at feilmatrisen uttrykker treffprosenter korrigert for geometrisk unøyaktighet. 14

5 Datagrunnlag Kapittelet inneholder en beskrivelse av de ulike datasett som er brukt i analysene. Først gis en oversikt over de ulike kildene for referansedata som ble analysert og hvilken bearbeiding som ble gjort før dataene kunne brukes som treningsdata for klassifikasjonen. Deretter følger en beskrivelse av satellittdataene og andre heldekkende støttedata som ble brukt i Sør-Trøndelag og Nord-Østerdalen. 5.1 Referansedata 5.1.1 Data for skogareal 5.1.1.1 Bestandsskogstakst Bestandsskogstaksten er en takst for skogeieren. I hovedsak er bestandsdataene fra skogbruksplanleggingen konsentrert om det produktive skogarealet. Bestand er behandlingsenheten som skogeieren forholder seg til, og den skal være relativ ensartet med hensyn på bonitet, tetthet, alders- og treslagssammensetning. Der spesielle arealtyper grenser inntil det produktive skogarealet kan disse være integrert som bestand. I enkelte tilfeller kan for eksempel myr, ikke produktiv skog og vann danne bestand når dette er viktig informasjon for skogbehandlingen i området. Bonitering og avgrensningen mot uproduktive arealer er ofte tatt fra Digitalt markslagskart (DMK). Bestandsdataene inneholder informasjon om skogens tetthet, men denne er uttrykt som trevolum og ikke kronedekning, som er det satellitten måler. Vi utledet kronedekning fra Landbruksdepartementets godkjente funksjoner for volumberegning. For gran og furu la vi til grunn Tomters funksjoner basert på volum /daa og middelhøyde, og for lauv brukte vi Galaaens funksjon der også hogstklasse var inkludert (Landbruksdepartementet 2003). Videre forsøkte vi å justere for at lauvskog, spesielt yngre lauvskog var klart underrepresentert i bestandsdataene. Kun 7 % av bestandsdataene var lauvdominert, mens gran og furudominert skog hadde henholdsvis 72 % og 22 % av observasjonene. En del lauvskog ble digitalisert inn manuelt basert på flybilder. Før bestandsdata kunne brukes til trening av satellittdata måtte det brukes mye tid på omkoding og siling. Bestandsdata vi hadde tilgjengelig dekket et areal på hele 1778 km 2 i Sør-Trøndelag (figur 5.1). Av dette inneholdt 452 km 2 informasjon om volum. Dette utgjør 5 % av skogen fra N50 i studieområdet og 11 % av produktiv skog i Sør-Trøndelag. Samlet gir dette mye data, men arealet er sterkt konsentrert sentralt i fylket og dekker for det meste lavereliggende, produktiv skog. Bestandsskogdataene ble benyttet som treningsdata for å etablere datalag som beskrev tettheten av skog, dominerende treslag (gran, furu, lauv) og hogstklasser. Siden en stor del av bestandene var blitt hogd mellom kartleg- Figur 5.1. Dekning av kartdata fra bestandsskogtaksering i Sør- Trøndelag. Omkodet til forenklede klasser for treslag. 15

Satellittdata til kartlegging av arealdekke ging og tidspunktet da opptak av satellittbilde fant sted, måtte det mye siling av data til for å fjerne denne typen støy. Dette silingsarbeidet var meget tidkrevende. 5.1.1.2 Landsskogtakseringen Landsskogstakseringen utføres av Norsk institutt for jord- og skogkartlegging (NIJOS) og er en utvalgsregistrering innenfor små flater med radius 8,92 meter (250 m²). Takseringen har som oppgave å skaffe ressurs- og miljødata for skogarealene i Norge (http://skog.nijos.no). Registreringene startet i 1919, og senere er syv mer eller mindre fullstendige landsomfattende registreringer blitt gjennomført. Landsskogtakseringens data er samlet inn fra prøveflater som er lagt ut i et systematisk nett. Over hele landet med unntak av Finnmark er det lagt ut permanente prøveflater i et forband på 3x3 km. Selv om det ikke finnes trær innenfor en prøveflate vil flata etableres og få informasjon om vegetasjon og hogstklasse for den nærliggende skogen. Hvert fylke får mellom 1000 og 1500 permanente flater innefor arealet som er vurdert til å være skog. Flatene oppsøkes hvert 5. år, og danner grunnlaget for fylkesvis skogstatistikk. Alle markslag under barskoggrensa omfattes, men det er bare på skogsmark at det blir gjort en detaljert beskrivelse. Takseringene av Sør-Trøndelag fylke i perioden 1996-2000 inngår som ledd i analysene (figur 5.2). Registreringen er basert på 1032 permanente prøveflater med skoginformasjon, som er lagt ut over fylket i henhold til et bestemt system. 99 av disse er delte flater som grenser til andre arealtyper (skogkant). Fra hver prøveflate benyttet vi informasjon om treslagssammensetning, bonitet, høyde og trevolum. I forhold til et arealmessig lite fylke som Østfold (Tomter & Eriksen 2001) som har 965 permanente flater (hvorav 79 er delte) med skoginformasjon, er det dermed relativt få punkt tilgjengelig for Sør-Trøndelag. Av flatene i produktiv skog har Østfold faktisk flere enn Sør-Trøndelag, henholdsvis 742 mot 501 flater. Med et areal på 4140 km 2 produktiv skog (SSB 2003), nesten det dobbelte av skogarealet i Østfold (2292 km 2 ) blir det for lite data til å fange opp den variasjonen som er i Sør-Trøndelags skoger. Figur 5.2. Dekning av punkter fra Landsskogtakseringen i Sør-Trøndelag. Omkodet til forenklede klasser for treslag. 5.1.1.3 Tilleggsdata for uproduktiv skog Siden dekningen av digitale bestandsdata var konsentrert til de sentrale deler av Sør-Trøndelag var denne datakilden ikke tilstrekkelig til å fange opp de ulike skogtyper, spesielt ikke i den uproduktive skogen mot fjellet. Landsskogtakseringens punktdata blir også for få til alene å være egnet som referansedata for tolking av satellittdata. To alternative kilder til referansedata ble derfor utprøvd. En gikk ut på å kombinere informasjon fra DMK og Landsskogtakseringen med satellittdata. Den andre var bruk av vegetasjonskart. For i det hele tatt å kunne få treningsdata på treslagsfordeling i områder med lite referansedata beregnet vi prosent gran, furu og lauv basert på sammenhengen mellom disse variablene fra Landsskogtakseringen og data fra heldekkende datasett vi hadde tilgjengelig. Vi kjørte multiple regresjoner med prosentandelen fra Landsskogtakseringen som avhengig variabel og data fra DMK, satellittdata, høydemodellen og geografisk plassering (x og y koordinater) som forklaringsvariabler. 16

Datagrunnlag Fra DMK (Bjørdal m.fl. 2004) brukte vi ATIL = 24 (barskog) eller 25 (blandingsskog) som utvalg for furu og gran, og ATIL = 25 (blandingsskog) eller 26 (lauvskog) som utvalg for lauvskog. De kategoriske variablene fra ASKOG (verdiene 11, 12, 13, 14) ble brukt som kontrast. Fra Landsat-dataene brukte vi rød kanal, vegetasjonsindeksen NDVI og forskjeller i NDVI mellom mai og juli, og fra høydemodellen de avledede produktene varmekoeffisient og vegetasjonsgeografisk sone. Alle kontinuerlige variabler. I utvelgelsen av modeller brukte vi Akaiki Informasjonskriterium (AIC, Akaiki 1973). Vi gjorde slike analyser på behandlingsområde 2 som dekker blant annet hele Fosen-halvøya og kommunene Agdenes og Snillfjord (se kapittel 6.2.1). For skogen i fjellnære områder forsøkte vi å bruke vegetasjonskartet fra NIJOS (se kapittel 5.1.3.1). Dette ble kodet om til gran, furu og lauvskog etter hovedtypen. Dette gav viktige treningsdata spesielt for å kunne skille bjørk og furu i fjellnære skoger. 5.1.2.2 3Q 3Q er et datasett som også produseres av NI- JOS. 3Q er et verktøy for tilstandsovervåking og resultatkontroll for jordbruk og kulturlandskap (Fjellstad m.fl. 2004). Overvåkningssystemet 3Q startet i 1998, etter 5 år med forprosjekter og evalueringer. 3Q har bruksområder knyttet til landbruksforhandlinger, lokal og nasjonal landbrukspolitikk, samt innrapportering til internasjonale organisasjoner som OECD. I overvåkningssystemet 3Q registreres informasjon om jordbruksarealer, skogsarealer, bebygde arealer, vann, is, snø m.m. De fleste dataelementer er registrert som polygoner, men noen er registrert som linjer eller punkt. Prøveflatene er 1 x 1 kilometer store kvadrater, som er lagt ut i et forband på 3 x 3 kilometer. Det ferdige 3Q kartet er et resultat av fotogrammetrisk konstruksjon med visuell tolking av flybilder (vanlige fargebilder) i målestokken 1: 12 500. Generelt skal alle arealenheter som grenser mot jordbruksareal være minimum 100 m². Som regel må andre arealenheter være minimum 1000 m². 103 ulike arealtyper er kartlagt. Tilstandsregistreringen skal gjentas hvert femte år. I Sør-Trøndelag hadde vi 28 prøveflater tilgjengelig av de 95 etablerte prøveflatene. 5.1.2 Data for skog, åpen mark og dyrket mark 5.1.2.1 Digitalt Markslags Kart (DMK) Digitalt Markslags Kart (DMK) er et nasjonalt datagrunnlag om arealtilstand og arealkvalitet for jord- og skogbruksområder og annet areal kartlagt for Økonomisk kartverk (ØK, nå: N5) i målestokk 1:5 000. Markslaget gir informasjon om dyrkingstilstand og driftsforhold på jordbruksareal, produksjonspotensialet (bonitet) i skog og på anna areal, og arealtilstand for alle andre arealkategorier (anna areal). Kartserien omfatter det meste av arealet under skoggrensa og oppdateres periodisk. Mer informasjon på http://www.nijos.no. Da dette prosjektet pågikk manglet store deler av Sør-Trøndelag (figur 5.3), men ved utgangen av 2005 var alle kommuner unntatt Oppdal, Rennebu og Holtålen ferdig kartlagt med DMK. Figur 5.3. Dekning av DMK fra NIJOS. Egenskap ASKOG er vist (bonitet i skog). 17

Satellittdata til kartlegging av arealdekke 5.1.3 Data for fjellområder 5.1.3.1 Vegetasjonskart fra NIJOS Vegetasjonskartlegging i målestokk 1: 20 000-50 000 er beskrevet av Rekdal & Larsson (2005). Slike vegetasjonskart ble ansett som en bra kilde for referansedata i fjellet. De er basert på feltarbeid og visuell tolking av svarthvite flyfoto i fotogrammetrisk arbeidsstasjon og de har et stort antall vegetasjonsklasser. Vi har sett på bruken av kartene Oppdal, Trollheimen og Gaula (Balle 2000), et kartlagt areal på totalt 4 622 km² (figur 5.4). En klassifikasjon av satellittdata basert på et direkte uttrekk av treningsdata fra vegetasjonskartet ble ikke vellykket. I en sammenlikning med satellittbildene var tydelig at de digitaliserte polygonene var sterkt romlig generalisert. Det ble gjort en hel rekke forsøk på å trekke ut essensen i vegetasjonskartet. En omkoding til bare seks klasser ble valgt. Alle blandede klasser i kartet ble luket bort. Nytten av tilleggssymbolene i kartet ble vurdert, men Figur 5.4. Dekning av vegetasjonskart fra NIJOS. Omkodet til forenklede klasser for treslag og fjellvegetasjon. ikke funnet særlig nyttige da dette ikke virket systematisk gjennomført. Ved å studere vegetasjonskartet mot bildedata fra SPOT5, IRS-1C og fly, kunne vi for hver vegetasjonsklasse sette opp hvilke minimums- og maksimumsverdier NDVI-indeksen hadde i sommeropptaket fra Landsat. Flere runder med siling der usikre data ble fjernet samtidig som variasjonen ble ivaretatt var nødvendig for i det hele tatt å kunne bruke disse dataene. 20 % av vegetasjonskartet var igjen etter siling. Noe tilleggsdigitalisering måtte til. Vegetasjonskartet gav til slutt data som kunne brukes til trening av satellittdata. Det var arbeidskrevende å jobbe med data som gav så lite samsvar med referansepunkt og bildedata. Antallet klasser ble skuffende få, da en viss grad av gjenkjenning av klassene i Landsatbildet var nødvendig på grunn av usikkerheten i treningsdataene. Det ble heller ikke mulig å skille intakte lavmatter fra slitte lavmatter. 5.1.4 Andre tilgjengelige kartdata 5.1.4.1 Vegetasjonskart fra andre institusjoner Vi innhentet analoge vegetasjonskart med tanke på å hente treningsdata fra disse. Vegetasjonskartene Flekkvika, Gauldalsvidda, Gåvålia, Nord-Fosen, Sandaneset og Garbergselva, er skannet til TIFF-format og georeferert til WGS 84 UTM sone 32. Kartene er basert på ØK eller 1: 50 000 kart. Det er deretter tegnet inn vegetasjonsavgrensinger som er fargelagt eller markert med symbol i henhold til legenden. Da dette var gamle papirkart viste det seg vanskelig å georeferere kartene slik at den geometriske nøyaktigheten ble god nok til bruk sammen med nyere kart og bildedata. Videre viste det seg å være tidkrevende å benytte ikke-vektoriserte tematiske kart selv når de var kartreferert. Dette skyldes at det var vanskelig å lese farge og tegnkoder i kartene og at det må digitaliseres ut flater eller punkt manuelt. I satellittbildene kunne en også se stor variasjon innenfor hver avgrensning i vegetasjonskartene. De plantesosiologiske legendene i disse kartene er heller ikke lett å overføre til fysiske egenskaper egnet for automatisert flyog satellittbildekartlegging. 18

Datagrunnlag 5.1.4.2 Kart over naturtyper Det ble plukket ut en del flater fra Naturbase (http://dnweb5.dirnat.no/nbinnsyn/) til trening. Disse flatene var sterkt generalisert, men etter visuell kontroll mot fly- eller satellittdata ble noen av dem lagt til treningsdataene. En del bestander av furuskog ble hentet inn på denne måten. 5.1.5 Høyoppløselig bildemateriale Høyoppløselige fly- og satellittbilder ble kun benyttet til visuell tolkning og kontroll i dette prosjektet. Ved å sammenlikne disse bildene med Landsat kunne en identifisere bestander av for eksempel myr, lauv- og ungskog. Bruk av automatisk klassifikasjon på slike bildedata er for tiden under utprøving andre steder i landet. 5.1.5.1 Egne opptak av flybilder I august 2001 ble det foretatt stripeflyginger med småfly utstyrt med digitale kamera og en GPS/INS løsning over Sør-Trøndelag (Lieng m. fl. 2002). To kameratyper ble utprøvd, et Kodak 760 digital speilreflekskamera og et Duncan- Tech firebånds kamera. Stereobetraktning var mulig med overlappende bilder fra begge kameraene, men geometrisk hadde bildene en utilfredsstillende presisjon. På grunn av at bildene kunne ha geometriske unøyaktigheter på opp til 100 meter, ble de kun benyttet til innsamling av punkter i felt og til skjermdigitalisering der det forelå annet materiale til støtte for å få en kartriktig plassering. Det ble imidlertid laget to ortofoto av Kodak bildene over større områder, Gaula deltaet og Svorka nordøst for Meldal. 5.1.5.2 Nye digitale flyfotokamera Det har siden 2003 vært gjort forsøk med bruk av nye digitale spesialkamera for vertikalfotografering fra fly i Norge. Fra 2004 var slike kamera i operasjonell drift. Dataene har en spektral informasjon som gjør dem meget egnet til fangst av referansedata, og med nøyaktige GPS- og INS-målere kan disse foto georefereres til en meters nøyaktighet uten bruk av bakkeinnmålte støttepunkt. Denne datakilden er derfor meget lovende for bruk til å etablere treningsdata for satellittkartlegging. Det ble ikke mulig å prøve slike bildedata i Sør-Trøndelag, men de er benyttet i kartleggingsprosjekt på Hardangervidda og i Setesdal/Ryfylkeheiene. 5.1.5.3 FKB ortofoto Tilgangen til ortofoto har blitt betydelig forbedret i 2005 med etableringen av Norge i Bilder som Web Map Server (WMS). Dette har kommet mot slutten av kartleggingen i Sør-Trøndelag og har bare blitt delvis utnyttet. Farge og svarthvite ortofoto er ikke alltid like gode til tolkning av vegetasjon, men i dette prosjektet er de benyttet blant annet til vurdering av tett og åpen skog, tresatt og ikke tresatt myr (se http://www.norgeibilder.no/). 5.1.5.4 Høyoppløselige satellittbilder Med høyoppløselige satellittbilder menes data hvor den romlige oppløsningen er bedre enn 6 meter. Dette omfatter satellittene SPOT5 og IRS med pankromatiske bånd på 5 og 5,8 meter, og de meget høyoppløselige satellittene hvor det pankromatiske båndet har 0,6-1 meters oppløsning. For satellitter i oppløsningsområdet 5-6 meter er det behov for mange feltdata som støtte for å kunne gjøre visuell tolking, for satellitter med oppløsning på 1 meter eller bedre kan mye tolkes bare ved å studere bildene. De meget høyoppløselige satellittene (IKONOS, Quickbird og Orbview) har i tillegg til den økte visuelle gjenkjenning også radiometriske egenskaper som er de samme som Landsat bånd 1-4. En stor del av Sør-Trøndelag er dekket av satellittbilder med 5 meters oppløsning fra SPOT og IRS satellittene. Sammen med observasjoner gjort i felt er disse blitt benyttet til å digitalisere flere bakkesannheter. Fjellvegetasjon, menneskeskapte inngrep og vekststadier i skogbruket er tema som kan tolkes tilfredsstillende i disse bildene. Fjellbjørkeskog og åpen skog i nordboreal sone kan være heller vanskelig å tolke i en slik oppløsning, grunnet forvekslingen som oppstår med mark- og buskvegetasjon. I to mindre områder innenfor studieområdet ble det i 2004 bestilt opptak med QuickBird 19

Satellittdata til kartlegging av arealdekke satellitten for andre prosjekter. Vi fikk tilgang til disse bildene mot slutten av 2004, men det tok noe tid før de var geometrisk korrigert. Dermed ble bildene ikke tatt i bruk før mot slutten av prosjektet. De høyoppløselige satellittbildene var til stor nytte for å innhente nye treningsdata og til verifisering, spesielt i Østerdalen der vi hadde lite referansedata. 5.1.6 Punktbasert skjermdigitalisering Dag Inge Øien ved NTNU Vitenskapsmuseet i Trondheim har sammen med andre samlet inn punkter fra en hel rekke lokaliteter i Sør-Trøndelag basert på SatNat-kodesettet (Hjeltnes & Øien 2003). Hensikten med dette arbeidet var å skaffe detaljerte data til trening og validering av klassifiseringen. Siden dataene også skulle brukes til validering var det viktig at sikkerheten i klassifikasjonen var meget god. Samtidig var det behov for et stort datamateriale for å kunne fange opp all variasjon som var innen kartleggingsområdet. Det ble derfor valgt en kombinasjon av feltregistreringer og registreringer fra andre kilder som eksisterende vegetasjonskart, flyfoto (både de som ble tatt i prosjektet og andre), samt IRS og SPOT5 satellittbilder. Problemet med punkt samlet inn i felt er at det er vanskelig å ta hensyn til den romlige skalaen informasjonen skal representere. En observasjon beskriver ikke gjennomsnittet av en Landsat piksel (0,9 dekar), men ofte et mindre areal. For å nyttiggjøre seg av slike observasjoner er et detaljert bildegrunnlag til stor hjelp når informasjonen skal overføres til en lavere oppløsning. For å få en effektiv skjermdigitalisering av punkt fikk vi laget til et eget script i ArcView og utviklet et registreringssystem som i større grad enn eksisterende systemer var egnet for bruk sammen med fly- og satellittbasert bildedata (Hjeltnes & Øien 2003). Totalt samlet Vitenskapsmuseet inn 6174 punkt. I ettertid viser det seg at punktene har en skjev fordeling både geografisk og klassemessig (over- og underrepresentasjon av klasser). Den tematiske og geografiske nøyaktighet er også mangelfullt dokumentert. Det er dermed ikke mulig å rangere punktene etter kvalitet og fjerne usikre observasjoner. Datasettet er likevel det beste vi har for åpne områder og er derfor brukt for validering. 5.2 Satellittbilder og avledede vegetasjonsindekser 5.2.1 Valg av satellittbilder I denne rapporten er det valgt å fokusere på multispektrale opptak fra den optiske sensoren ETM+ (Enhanced Thematic Mapper) om bord Tabell 5.1. Satellittdata benyttet i kartleggingen av Sør-Trøndelag. Termiske og pankromatiske bånd ble ikke benyttet i analysene. For IRS-1C LISS ble i tillegg ikke bånd 4 benyttet, grunnet lavere romlig oppløsning og mye støy. Sensor Ant. bånd Path Row Dato Årstid L7-ETM+ 6 198 16 19.mai.02 Vår L7-ETM+ 6 199 15,16 07.mai.01 Vår L7-ETM+ 6 200 15,16 18.apr.03 Vår L7-ETM+ 6 198 16 23.aug.02 Sommer L7-ETM+ 6 199 15 24.jun.01 Sommer L7-ETM+ 6 199 16 06.aug.99 Sommer L7-ETM+ 6 200 15 05.aug.02 Sommer L7-ETM+ 6 201 15,16,17 21.jul.00 Sommer IRS-1C LISS 3 18 20,21 21.jul.02 Sommer L5-TM 6 199 15,16,17 09.aug.03 Sommer L7-ETM+ 6 199 16 25.sep.00 Høst L7-ETM+ 6 200 15,16 02.okt.00 Høst 20