4 Metode Metode for prosessering og klassifikasjon av satellittdata bygger på produksjonslinjer som er etablert ved de samarbeidende institusjoner. Disse har tidligere bare i liten grad arbeidet spesifikt med naturtypene relatert til håndboka, men har betydelig erfaring innenfor bl.a. vegetasjonskartlegging og arealklassifikasjon. Vitenskapsmuseet har også deltatt i utviklingsarbeidet omkring naturtypekartlegging og miljøovervåking. SK har i særlig grad arbeidet med utvikling av satellittbildekart. For de ulike områdene er følgende typer satellittdata og metoder benyttet; 1. Nordreisa - Landsat TM fra 25.8.96. Automatisk metodikk. Kartdata fra N250. Dyrka mark fra N50. 2. Levanger - SPOT 4 (PAN+XI) opptak fra 13.9.99. Visuell tolking og automatisk metodikk. Kartmateriale N50, terrengmodell DTED. 3. Follo - IRS -1C (LISS og PAN) fra 9.7.97. SPOT (XS+PAN fra 1995) har også vært tilgjengelig for prosjektet, men fargekodet IRS-1C ble foretrukket fordi geometrisk oppløsning var bedre. Visuell tolking sammen med generalisert DMK i kartprogrammet FYSAK. 4. Grenland - IRS-IC (LISS og PAN) fra 9.7.97. Automatisk metodikk («clustring») supplert med visuell tolking. Kartdata fra N50. 4.1 Satellittbildekart Om satellittbildekart Satellittbildekart er både bilde og kart, d.v.s. bilder av terrengoverflaten som er geometrisk korrigert og tilpasset en kartprojeksjon. De kan bestå av rene bildedata (rasterdata) eller de kan bestå av en kobling mellom bildedata og kartdata, f.eks veier, administrative grenser og navn. Satellittbildekartet er gitt en fargekoding som i dette tilfellet prøver å fremheve ulike arealbruksklasser og naturtyper best mulig. Fargene er imidlertid "kontinuerlige" (uten grenselinjer) og bildet er egnet som oversiktsbilde som kan oppfattes umiddelbart og intuitivt, men det inneholder også en mengde nyanser som er egnet for visuell tolking av naturtyper og avgrensning av disse. Prosessering av satellittbildekart Rådata eller systemkorrigerte satellittdata er i utgangspunktet bare matriser med tallverdier for hvert bildeelement (piksler) for de ulike spektrale båndene fra satellittopptaket, koblet med noen opplysninger om opptakssituasjonen. For å kunne bruke bildet sammen med kartdata, altså lage et satellittbildekart, må det korrigeres geometrisk. Passpunkt som refererer seg til veier eller andre gjenkjennelige objekter i bildet velges ut. Referansekoordinater for passpunktene hentes ut fra kart. Man retter så bildet opp geometrisk, helst sammen med en høydemodell. Den geometriske nøyaktigheten Satellittbildekartet får er avhengig av oppløsningen til høydemodellen og kvaliteten til passpunktene. For å gi Satellittbildekartet farger som brukeren forbinder med ulike naturforhold, må de opprinnelige fargene som satellitten leverer forandres. Skogen opptrer i utgangspunktet 28
med en rød farge i bildene, og den røde fargen forandrer man derfor til grønt for den delen som representerer bartrær og rødgul for løvskog. Myr og dyrka mark er det ønskelig å gjengi slik at disse kan skilles fra skogen. Etter at bildet er geometrisk opprettet og fargejustert, skorper man opp den multispektrale delen av bildet med den pankromatiske. Den multispektrale delen av bildet gir informasjon om naturforhold, mens den mer høyoppløselige pankromatiske delen i første rekke viser tekstur og infrastruktur. Slik får man et bilde med både farger og detaljer. Denne kombinasjonen av lav- og høyoppløselig informasjon er nødvendig for å kunne vise satellittbildekartet i relativt store målestokker, for eksempel M l : 35.000 for IRS-1C. Fig. 12 Fargekoding av satellittbilder. Fargene i det multispektrale bildet (bilde 11.v.) fargetransformeres og justeres (bilde 2). Deretter settes det sammen (oppskarpes) med det pankromatiske bildet (bilde 3) til et fargekodet satellittbildekart (bilde 4 t.h.). 3D-visualisering av satellittbildekart En del mennesker har problemer med persepsjon av tradisjonelle kart. 3D-visualisering med satellittbilder gjør det mulig å forstå naturforhold på en ny måte. Ved å se en modell av landskapet på skrå ovenfra, forstår brukeren lettere terrengforhold og arealtypenes fordeling i terrenget. I kombinasjon med en digital terrengmodell er det enkelt å lage en tredimensjonal landskapsmodell av et satellittbildekart. Se figur 4, 6 og 7. 4.2 Geometrisk nøyaktighet - GIS-integrering GIS-datakilde DMK 1 : 5.000 IRS-1C (5 m) SPOT4 (10 m) N50 Landsat 7 (15m) Middelfeil 2-5 m 5-15 m* 10-15 m* 10-15 m 15-30 m* Tabell 4. Geometrisk nøyaktighet. * = middelfeilen avhenger av prosesseringen, jfr. 4.1 Er satellittbildet tatt opp med høv skråvinkel (jfr. kap. 3.1), kan man forvente noe lavere geometrisk nøyaktighet. Et digitalt satellittbildekart vil kunne brukes i et GIS-system som bakgrunnsbilde ved tolking, presentasjon eller digitalisering. Satellittbilder brukes på samme måte som ortofoto i digital form. Dagens Windows-baserte GIS-system har normalt muligheter for visning av raster- og vektordata samtidig. Programmene Fysak, V/G-innsyn, ArcView rn.fl. er de mest benyttede i Norge i dag. 29
N50-kartdata kan være noe unøyaktige og generaliserte til bruk sammen med IRS-IC. Små lokaliteter, for eksempel et 30 meter bredt skogholt på N50, kan i verste fall bomme helt når den legges oppå satellittbildekartets gjengivelse av skogholtet. Minste arealstørrelse i et kart man ønsker å framstille, må derfor tilpasses den minst nøyaktige/detaljerte datakilden. Satellittdataenes antatte eller beregnede geometriske middelf eil bør være dokumentert ved levering. 4.3 Visuell tolking/klassifikasjon Metoden for tolking av satellittbildedata i Folio ble basert på bruk av satellittdata som rasterbilde, kartdata frå digitalt markslagskart (DMK), visuell tolking, digitalisering og redigering på skjerm i programmet FYSAK (Anon. 1999). De tolkede arealene ble lagret i SOSI-format. Satellittbildet ble lagt inn som rasterbilde (Tiff-format) i bakgrunnen på skjermen. Temadata frå DMK ble deretter lagt over satellittbildet. Polygoner for myr, barskog og løv- og blandingsskog ble valgt som basis for videre tolking. I satellittbildene vil det kunne forekomme overlappende fargekombinasjoner, for eksempel er frodig grønn grasmark ofte svært lik frodig lauvskog. Struktur og mønster i bildene vil være noe forskjellig, men feilklassifikasjon kan lett inntreffe. Det ble foretatt en vurdering av tolkingspotensial med og uten DMK. Innledningsvis ble det slått fast at tolkbarhet og presisjon ble såpass mye forbedret ved bruk av DMK, at påfølgende tolking er foretatt med DMK som tilleggsinformasjon. Dette sikrer presisjon i tolkingen da man er sikker på hvilken naturtype man tolker og kan konsentrere seg om variasjon innen denne typen. Ved tolkingen ble kjennskap til aktuelle lokaliteter utnyttet og noe feltarbeid for kalibrering av tolking foretatt. Feilregistreringer vil supplere tolkingen og benyttes til å verifisere klassifisering som er usikker. Ulike typer biologiske data kan også benyttes. Dersom ikke DMK er tilgjengelig for et område, vil markslag fra N50 utgjøre viktig supplerende informasjon (benyttet for Grenlandsområdet). Ved arealklassifikasjon ut frå satellittdata, avgrenses naturtypeklassene i første rekke ut frå fysiqgnomiske forhold, men ved kombinasjon av informasjon fra bilder og kart, lokalkunnskap og generell økologisk kunnskap er det mulig å avlede informasjon om oversiktlig fordeling av naturtyper og vegetasjon. For en god del av de aktuelle naturtyper vil det ikke være mulig å fastslå den eksakte utbredelsen av forekomsten, men det er mulig å utelukke store areal som ikke vil være aktuelle områder for denne naturtypen. Avgrensningen viser da "potensielt" forekomstområde og feltarbeid eller nærmere undersøkelser basert på f.eks oppdaterte flybilder er nødvendig for en mer eksakt avgrensning. 30
4.4 Automatisk metodikk Ved automatisk metodikk er det vanlig å dele bearbeidingsprosessen i tre arbeidsoperasjoner - pre- og postklassifikasjon, samt kartframstillmg. I preklassifikasjonen inngår valg av klassifikasjonsmetode, gjennomføring av klassifikasjon og analyse av det spektrale innholdet i utskilte klasser. Klasser som er nærstående med hensyn på spektralt likhet, blir slått sammen i nye spektrale enheter. Ved framstilling av vegetasjons- og naturtypekart basert på satellittdata, har det vist seg at enkelte vegetasjonsenheter vanskelig lar seg identifisere og skille ut kun ved bruk av spektrale karakteristikker. For å gi en mer presis identifikasjon og avgrensning av slike enheter, er det nødvendig å bruke tilleggsinformasjon. Prosessen med å integrere tilleggsinformasjon til spektralt klassifiserte data, går ofte under betegnelsen post-klassifikasjon. Preklassifikasjon - billedbehandling Multispektral klassifikasjon omfatter gruppering av bildeelementer i såkalte klynger eller «clusters». Denne grupperingen tar utgangspunkt i et mål for likhet mellom elementer. Likhet mellom bildeelementene beregnes gjerne etter formelen Euklids distanse. To elementer føres til samme klynge når likheten mellom disse er innafor en bestemt avstand. Er avstanden større føres elementet til en annen klynge, eller det opprettes nye klynger. Klyngene spres ut i et multidimensjonalt rom. Basert på denne tilnærmingen er det vanlig å tilordne pikslene etter avstand fra senterpunktet til nærmeste «cluster». Multispektral klassifikasjon kan utføres etter to ulike tilnærmingsmåter - styrt og ikkestyrt klassifikasjon. Ved styrt klassifikasjon velges det ut treningsområder basert på kjent informasjon om området. Det spektrale innholdet innen treningsområdene brukes i neste omgang til å klassifisere hele studieområdet. Ved ikkestyrt klassifikasjon deles datasettet inn i et gitt antall spektralklasser. Tolking og verifisering av klassene som opprettes i denne prosessen, skjer i ettertid. Viktige hjelpemidler i tolkingsarbeidet er analyse av det spektrale innholdet i hver klasse, feltbefaring, integrering av tilleggsinformasjon og visuell inspeksjon av utskilte klasser. Resultatet av denne prosessen er et klassifisert bilde og ulike typer statistisk informasjon om utskilte klasser. En tilfredsstillende inndeling av et satellittbilde i spektrale klasser kan kun oppnås når to klasser er numerisk adskilt fra hverandre. Dersom det er en betydelig spektral overlapp mellom klassene, vil dette generere usikkerhet ved klassifikasjonen. Ulike algoritmer kan brukes for å teste om to klasser lar seg skille fra hverandre basert på gitt spektral innhold. Første ledd ved beregning av spektral likhet omfatter beregning av likhetskoeffesienter mellom klassene. Likhetene framstilles gjerne som en likhetsmatrise. Basert på informasjonen i matrisa er det vanlig å framstille likhet mellom klasser som et dendrogram. Dette gir en framstilling av spektral likhet mellom klasser og grupper av klasser. Det finnes flere algoritmer som bestemmer hvordan de ulike klassene skal slås sammen i dendrogrammet. En vanlig måte er å gjøre sammenslåingen ved bruk av metoden «average linkage». Denne metoden omfatter beregning av gjennomsnittlige likhet mellom par av klas- 31
ser. Klasser med størst gjennomsnittlig likhet blir slått sammen til en enhet. Etter sammenslåingen beregnes nye gjennomsnittsverdier og sammenslåingen fortsetter til alle klassene er plassert i en trestruktur. Trestrukturen gir et bilde av klasser som står hverandre nær med hensyn på spektral likhet og klasser som er klart adskilt fra hverandre. Informasjon om spektral likhet og spektral separabilitet er vanlig å bruke i vurderingen om klasser med stor likhet skal slås sammen eller ikke. f f Preklasslftkasjon Satellittdata Klassifikasjon Postklassifikasjon * visuell tolking * automatisk -styrt -Ikke styrt * segmentering spektral likhet spektra! separabllltet Tolkning / validering EM Naturtema Feltdata Geologi Andre Første o kartproc r ir 1 * * + Arealanalyser Arealstatistikk: - forekomst Innen gitte temaklassør - forekomst høyde over havethelningsretning, helnlngsvl nket - forekomst feltpunkt -forekomst geologi Beslutningstre - kontekstuell korreksjon SOSI-konvertering / database Vektorlsering - polygrid - eliminate - dissolve - generalize Naturtema som vektoriserte lag Standardisert legend SOSI-format x"-^ l Vegetasjonskart J Fig 13. Produksjon av vegetasjonskart ved NORUT IT. Postklassifikasjon Mye informasjon om ulike natur- og arealtyper kan utledes basert på spektralinformasjon frå satellittdata. Likevel kan en ikke underslå at kun spektral informasjon i mange tilfeller ikke er tilstrekkelig for å gi en entydig og presis identifikasjon av gitte natur- og vegetasjonstyper. Ved bearbeiding av satellittdata har det vist seg at vegetasjonstyper med totalt forskjellig floristisk innhold og forekomst i ulike høydebelter, opptrer innen samme 32
spektralklasse. For å korrigere for slike feil i materialet, er det nødvendig å trekke inn data frå andre informasjonskilder. Naturtema frå topografiske kart og digitale terrengmodeller har her vist seg som et nyttige hjelpemiddel for å korrigere kartprodukt som kun baserer seg på spektra! informasjon. Postklassifikasjon kan deles inn i flere ulike deloperasjoner. I første trinn i denne prosessen er det nødvendig å gjøre en analyse av det preklassifiserte produktet mot tilgjengelige tilleggsdata. Ved bruk av naturtema frå topografiske kart er det nyttig å gi en oversikt over forekomst av hver spektralklasse innen hvert temalag (tettsted, dyrka mark, skog, myr, vann, fastmark). Denne informasjonen kan summeres i en todimensjonal tabell. På samme vis kan en sammenfatte terrenginformasjonen (helningsvinkel, retning, høyde over havet) om hver av de utskilte spektralklasser. Disse tabellene gir viktig informasjon ved formulering av beslutningsregler om hvordan korreksjonen av de ulike klassene skal gjennomføres. Beregning av statistisk sannsynlighet ved de ulike spektralklassene er et bærende element i formuleringer av beslutningsregler. Beslutningsreglene definerer om en klasse skal betraktes som en egen enhet elles splittes opp i nye klasser. Videre kan deler av en klasse føres til allerede eksisterende klasser. To eller flere klasser kan slås sammen. Selve postklassifikasjonen utføres ved bruk av GRID-modulen i Arclnfo. Frå topografiske kart skilles ulike temalag ut som egne "cover" og bearbeides videre til egne klasser. En god samregistrering av kart og det preklassifiserte bilde, er nødvendig for å få ut gode statistiske data. I GRID-modulen er det nå mulig å formulere kommandoer som utfører korreksjonen. For å få til en effektiv bearbeiding av datasettet programmeres det hele i AML (Arclnfos makro-språk). Kartframstilling - Arealberegninger - statistikk Sluttfasen i bearbeidingsprosessen, er her gitt betegnelsen kartframstilling. Arbeidsoperasjonene som inngår her, omfatter transformering av utskilte klasser til vektor form, bestemming av minste arealstørrelse, utarbeiding av tegnforklaring, fargesetting av vegetasjonsklasser som inngår i materialet og bestemming av målestokk for det endelige kartproduktet. Et viktig ledd i kartframstillingen er å relatere sluttproduktet til et gyldig system vegetasjonskartlegging i området. 4.5 Temakartproduksjon - databaseetablering Det er etablert temadatabaser for de ulike områdene som Arclnfo cover med polygoner for naturtyper/potensiell forekomst. Temadata er koblet mot utvalgte kartdata fra N50 for produksjon av temakart for de ulike områdene. Kartene er produsert som fargeplott i M 1:50 000 / 1:30 000. Arclnfo programvare er benyttet ved temakart-produksjonen. Dersom data foreligger med ferdig topologi (polygonstruktur) er det mulig å generere arealstatistikk for de klasser som er registrert. 33
i i l i 4.6 Verifisering av klassifikasjonen Det har ikke vært mulig (innenfor prosjektets rammer) å gjennomføre en systematisk verifisering eller evaluering av klassifikasjonen i de ulike områdene (f.eks. basert på rutenettsanalyse). Verifisering og kontroll er i første rekke gjennomført ved bruk av innhentede bakkedata, feltkontroll av utvalgte lokaliteter og sammenholding med informasjon basert på andre kilder; bl.a. detaljerte vegetasjonskart og tidligere registreringer knyttet til biologisk mangfold i området. Erfaringene herfra er for en stor del beskrevet i kapitlet om resultater. Under arbeidet i Follo har NIJOS lagt opp til at en person foretok tolking på skjerm, mens kontroll av resultatene ble foretatt av en annen person, mest mulig basert på feltkontroll. Dette ble gjort fordi den som hadde ansvar for feltkontroll og evaluering også foretok kartlegging av biologisk mangfold i Ås kommune og følgelig visste «fasiten». Denne fordelingen var derfor nødvendig for å få en mest mulig nøytral klassifikasjon. Det var viktig at den som tolket på skjerm og den som utførte feltkontroll var samkjørte og hadde en felles forståelse av innholdet i håndboka. Evalueringen baserte seg på en kombinasjon av eksisterende kunnskap om kjente lokaliteter, den pågående kartleggingen av biologisk mangfold i Follo, og selektiv oppsøking av et utvalg tolkete lokaliteter i felt. 34